將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備的制作方法
【專利摘要】本發(fā)明提供了一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備。上述方法應(yīng)用于終端設(shè)備,包括:獲取文本數(shù)據(jù);以及使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù),其中,所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成,所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。根據(jù)上述方法以及終端設(shè)備,通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù),從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表,并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換,因此在通話過程中自動收集語音數(shù)據(jù),而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制,就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
【專利說明】將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備,尤其涉及無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制就能夠?qū)⑽谋緮?shù)據(jù)轉(zhuǎn)換為用戶所期望的規(guī)定聯(lián)系人的語音數(shù)據(jù)的方法以及終端設(shè)備。
【背景技術(shù)】
[0002]如今,隨著科學(xué)的發(fā)展以及社會的進(jìn)步,電子產(chǎn)品更加人性化,出現(xiàn)了很多具有文本朗讀功能的終端設(shè)備。例如,出現(xiàn)了帶有短信朗讀功能的手機(jī),為老人、盲人等具有視力障礙的人等提供了很大的方便。此外,車載導(dǎo)航設(shè)備也具備了朗讀電子郵件、新聞等功能,保證了駕駛司機(jī)的行車安全。
[0003]然而,在這樣的朗讀功能中,朗讀聲音往往非常單調(diào),所有的短信、電子郵件、新聞等均通過事先錄制成的一種聲音進(jìn)行播放。這樣單調(diào)的聲音不僅讓用戶聽起來比較生硬、乏味。
[0004]為此,提出了用戶能夠根據(jù)自己的需要,將特定人的聲音作為朗讀的聲音的方案。采用這樣的語音朗讀功能,其聲音可以設(shè)定為自己所熟悉的人,因此能夠給用戶帶來親切感,可以使得用戶聽起來更加自然、舒服。但是,如果試圖模擬特定人的聲音,則需要使用該特定人的聲音定制文本/語音映射表。這就需要該特定人來特意為此進(jìn)行錄制,直到發(fā)音音素覆蓋率達(dá)到一定標(biāo)準(zhǔn)。這給該特定人以及用戶帶來很大的負(fù)擔(dān),可執(zhí)行性不強(qiáng)。
【發(fā)明內(nèi)容】
[0005]本發(fā)明鑒于以上課題完成,其目的在于,提供一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備,通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù),從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表,并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換,因此在通話過程中自動收集語音數(shù)據(jù),而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制,就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
[0006]本發(fā)明的一個實(shí)施例提供一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法,應(yīng)用于具有終端設(shè)備,包括:獲取文本數(shù)據(jù);以及使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù),其中,所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成,所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
[0007]本發(fā)明的實(shí)施例還提供一種終端設(shè)備,包括:通話數(shù)據(jù)保存模塊,配置來存儲通話數(shù)據(jù);以及處理模塊,配置來獲取文本數(shù)據(jù),并獲取使用文本/語音映射表從文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù),其中,所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成,所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
[0008]根據(jù)本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備,通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù),從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表,并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換,因此在通話過程中自動收集語音數(shù)據(jù),而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制,就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
【專利附圖】
【附圖說明】
[0009]圖1是用于說明將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的示意圖。
[0010]圖2是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,生成文本/語音映射表的一個優(yōu)選實(shí)施例的時(shí)序圖。
[0011]圖3是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,通話數(shù)據(jù)的篩選的流程圖。
[0012]圖4是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,覆蓋預(yù)定范圍的發(fā)音音素的檢測過程的流程 圖。
[0013]圖5是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,一個優(yōu)選實(shí)施例的流程圖。
[0014]圖6是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的不意圖。
[0015]圖7是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的流程圖。
[0016]圖8是用于說明本發(fā)明的終端設(shè)備的結(jié)構(gòu)的功能框圖。
【具體實(shí)施方式】
[0017]為使本領(lǐng)域的技術(shù)人員能夠更好地理解本發(fā)明的技術(shù)方案,下面結(jié)合附圖詳細(xì)說明本發(fā)明的本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法以及終端設(shè)備的【具體實(shí)施方式】。
[0018]【將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法】
[0019]下面,結(jié)合附圖來說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的【具體實(shí)施方式】。本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的實(shí)施例中,主要以將智能手機(jī)中的短信內(nèi)容轉(zhuǎn)換為語音數(shù)據(jù)為例進(jìn)行說明,但事實(shí)上轉(zhuǎn)換的文本數(shù)據(jù)不限于短信內(nèi)容,還可以是電子郵件,新聞等任何形式的文本數(shù)據(jù)。此外,終端設(shè)備還可以是PDA、平板電腦、電子閱讀器、車載導(dǎo)航等其他任何終端設(shè)備。因此,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在未經(jīng)創(chuàng)造性勞動而能夠獲得的所有其他實(shí)施例都屬于本發(fā)明保護(hù)的范圍。
[0020]圖1是用于說明將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的示意圖。如圖1所示,文本數(shù)據(jù)與語音數(shù)據(jù)之間的轉(zhuǎn)換一般通過文本/語音映射表來實(shí)現(xiàn)。文本/語音映射表中存儲了字符或者字符串與發(fā)音音素之間的對應(yīng)關(guān)系。在終端設(shè)備獲取文本數(shù)據(jù)后,使用文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。具體而言,首先識別該文本數(shù)據(jù)中的字符或者字符串。其次通過文本/語音映射表檢索到與該字符以及字符串對應(yīng)的發(fā)音音素。最后對該發(fā)音音素進(jìn)行拼接、調(diào)整、優(yōu)化,從而轉(zhuǎn)換為與該文本數(shù)據(jù)對應(yīng)的語音數(shù)據(jù)。可見,轉(zhuǎn)換出來的語音數(shù)據(jù)中的聲色、聲調(diào)、強(qiáng)弱等聲音取決于文本/語音映射表中存儲的發(fā)音音素。同一個文本數(shù)據(jù)可以通過不同的文本/語音映射表分別轉(zhuǎn)換為不同人的聲音的語音數(shù)據(jù)。本發(fā)明的實(shí)施例通過保存規(guī)定聯(lián)系人的通話數(shù)據(jù),從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表,并且使用該文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換,因此能夠在通話過程中自動收集語音數(shù)據(jù),而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制,就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
[0021]接下來,結(jié)合圖2說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,生成文本/語音映射表的一個優(yōu)選實(shí)施方式。圖2是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中生成文本/語音映射表的一個優(yōu)選實(shí)施例的時(shí)序圖。
[0022]首先,智能手機(jī)(終端設(shè)備)保存與規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S11)。在這里以電話的通話數(shù)據(jù)為例進(jìn)行說明,但需要指出的是,通話數(shù)據(jù)不僅包括電話的通話數(shù)據(jù),還可以包括通過微信(注冊商標(biāo))、LINE (注冊商標(biāo))等其他帶有語音通信功能的第三方應(yīng)用軟件的通話數(shù)據(jù)。這里的規(guī)定聯(lián)系人一般是關(guān)系親近的人,例如可以是親屬、愛人、或者特定的朋友。規(guī)定聯(lián)系人可以由用戶手動設(shè)定,也可以根據(jù)智能手機(jī)的通話記錄、短信記錄等通信記錄來確定,還可以根據(jù)智能手機(jī)的桌面圖像等圖片數(shù)據(jù)的來確定。根據(jù)通話記錄來確定規(guī)定聯(lián)系人,例如可以是通過識別在單位時(shí)間內(nèi)的通話次數(shù)或者通話時(shí)間超過一定閾值的聯(lián)系人來確定。根據(jù)短/[目記錄確定規(guī)定聯(lián)系人,例如可以是通過識別在單位時(shí)間內(nèi)短/[目次數(shù)或者短信內(nèi)容字?jǐn)?shù)超過一定閾值的聯(lián)系人來確定。根據(jù)智能手機(jī)的桌面圖像來確定,例如可以是通過桌面圖像的人臉識別,與電話簿中存儲的人臉進(jìn)行匹配,從而識別該聯(lián)系人。優(yōu)選地,智能手機(jī)還可以對通話數(shù)據(jù)進(jìn)行篩選,當(dāng)通話質(zhì)量或者置信度達(dá)不到一定程度時(shí),拋棄該通話數(shù)據(jù),以保證通話數(shù)據(jù)的準(zhǔn)確性。該篩選過程將在后面詳細(xì)敘述。
[0023]接下來,智能手機(jī)將所保存的通話數(shù)據(jù)發(fā)送至服務(wù)器(步驟S12)。服務(wù)器可以是通過廣域網(wǎng)連接的遠(yuǎn)程服務(wù)器,也可以是通過局域網(wǎng)或者其他方式連接的近程服務(wù)器。智能手機(jī)可以積攢多個通話數(shù)據(jù),并且達(dá)到一定數(shù)量后一并發(fā)送至服務(wù)器,也可以是每當(dāng)保存一個通話數(shù)據(jù)就立即向該服務(wù)器發(fā)送該通話數(shù)據(jù),還可以是其他任何形式。服務(wù)器接收并存儲來自智能手機(jī)的規(guī)定聯(lián)系人的通話數(shù)據(jù),形成通話數(shù)據(jù)的集合。
[0024]接下來,服務(wù)器根據(jù)所存儲的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表(步驟S13)。具體而言,對通話數(shù)據(jù)進(jìn)行解析、并且分解為各個發(fā)音音素,并與字符或者字符串建立對應(yīng)關(guān)系,從而生成文本/語音映射表。優(yōu)選地,為了保證轉(zhuǎn)換出來的語音數(shù)據(jù)的準(zhǔn)確性,還可以對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測,并且在覆蓋預(yù)定范圍的發(fā)音音素后生成文本/語音映射表。該檢測過程將在后面詳細(xì)敘述。
[0025]最后,服務(wù)器將生成的文本/語音映射表發(fā)送給智能手機(jī)(步驟S14),以供智能手機(jī)使用該生成的文本/語音映射表進(jìn)行文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換。
[0026]由于通常需要大量的通話數(shù)據(jù)來生成文本/語音映射表,因此在上述生成文本/語音映射表的優(yōu)選實(shí)施方式中,由服務(wù)器端存儲通話數(shù)據(jù),并根據(jù)規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表,從而能夠有效減少智能手機(jī)的負(fù)載,提高轉(zhuǎn)換效率。當(dāng)然,本領(lǐng)域技術(shù)人員知道,上述生成文本/語音映射表的步驟也可以在智能手機(jī)中進(jìn)行。
[0027]下面,結(jié)合圖3來詳細(xì)說明通話數(shù)據(jù)的篩選過程的一個優(yōu)選實(shí)施方式。圖3是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,通話數(shù)據(jù)的篩選的流程圖。
[0028]首先,獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S31)。
[0029]接下來,判斷該通話數(shù)據(jù)的信號噪音比是否大于第一閾值(此處例如為20dB),并且噪聲水平小于第二閾值(此處例如為45dB)(步驟S32)。[0030]當(dāng)信號噪音比大于20dB并且噪聲水平小于45dB (步驟S32,是)時(shí),說明該通話數(shù)據(jù)的質(zhì)量較好,判斷為適宜作為生成文本/語音映射表的元素,因此結(jié)束篩選過程,即保存通話數(shù)據(jù)。
[0031]當(dāng)信號噪音比小于20dB或者噪聲水平大于45dB (步驟S32,否)時(shí),說明該通話數(shù)據(jù)的質(zhì)量較差,繼續(xù)分析通話數(shù)據(jù),判斷其置信度是否大于第三閾值(第三閾值取值范圍為O?1,此處例如為0.85)(步驟S33)。
[0032]當(dāng)置信度大于0.85時(shí)(步驟S33,是),說明該通話數(shù)據(jù)的可識別性高,判斷為適宜作為生成文本/語音映射表的元素,因此結(jié)束篩選過程,即保存通話數(shù)據(jù)。
[0033]當(dāng)置信度小于0.85時(shí)(步驟S33,否),說明該通話數(shù)據(jù)的可識別性低,判斷該通話數(shù)據(jù)不宜作為生成文本/語音映射表的元素,因此拋棄該通話數(shù)據(jù)(步驟S34),結(jié)束篩選過程。
[0034]因此,通過上述通話數(shù)據(jù)的篩選過程,可以實(shí)現(xiàn):僅在在滿足下述至少一個條件時(shí),保存該通話數(shù)據(jù),作為生成文本/語音映射表的元素的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合:
[0035](I)信號噪音比大于第一閾值并且噪聲水平小于第二閾值;
[0036](2)所述通話數(shù)據(jù)的置信度大于第三閾值。
[0037]需要指出,本領(lǐng)域技術(shù)人員知道,也可以是同時(shí)滿足上述兩個條件時(shí),保存該通話數(shù)據(jù)。
[0038]以上說明了在終端設(shè)備保存規(guī)定聯(lián)系人的通話數(shù)據(jù)之前進(jìn)行篩選的示例,但事實(shí)上不限于此,也可以在保存通話數(shù)據(jù)之后且生成文本/語音映射表之前進(jìn)行篩選。
[0039]通過上述篩選過程,能夠保證作為生成文本/語音映射表的元素的通話數(shù)據(jù)的通話質(zhì)量以及置信度,從而以保證了生成文本/語音映射表的準(zhǔn)確性。
[0040]下面,結(jié)合圖4來詳細(xì)說明對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測的一個優(yōu)選實(shí)施方式。圖4是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,覆蓋預(yù)定范圍的發(fā)音音素的檢測過程的流程圖。首先,獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S41)。[0041 ] 接下來,判斷所存儲的通話數(shù)據(jù)的集合是否覆蓋預(yù)定范圍的發(fā)音音素(步驟S42 )。這里的覆蓋音素的范圍可以根據(jù)實(shí)際需要進(jìn)行設(shè)定。很顯然,覆蓋的發(fā)音音素范圍越大,生成的文本/語音映射表越完整,轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音就越接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0042]當(dāng)所存儲的通話數(shù)據(jù)的集合沒有覆蓋預(yù)定范圍的發(fā)音音素時(shí)(步驟S42,否),說明該文本/語音映射表中的發(fā)音音素還不足以達(dá)到所要求的完整程度,因此暫不生成文本/語音映射表而再次返回到步驟S41而獲取該規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0043]當(dāng)所存儲的通話數(shù)據(jù)的集合覆蓋預(yù)定范圍的發(fā)音音素時(shí)(步驟S42,是),說明該文本/語音映射表中的發(fā)音音素已達(dá)到所要求的完整程度,因此生成文本/語音映射表(步驟S43)。
[0044]需要說明的是,本領(lǐng)域技術(shù)人員知道,當(dāng)智能手機(jī)將規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送給服務(wù)器,并在服務(wù)器存儲通話數(shù)據(jù)集合并生成文本/語音映射表時(shí),在服務(wù)器進(jìn)行上述檢測。此外,當(dāng)在智能手機(jī)中存儲通話數(shù)據(jù)的集合并生成文本/語音映射表時(shí),還可以在該智能手機(jī)中進(jìn)行上述檢測。
[0045]通過上述檢測,能夠保證構(gòu)成文本/語音映射表中的發(fā)音音素的完整性,使得使用該文本/語音映射表轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音更接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0046]然而,一般情況下需要積累大量且多樣的通話數(shù)據(jù),才能夠根據(jù)與規(guī)定聯(lián)系人之間的通話數(shù)據(jù)的集合來覆蓋比較完整的發(fā)音音素。因此,為了生成一個能夠模擬規(guī)定聯(lián)系人的聲音的文本/語音映射表往往需要很長時(shí)間。為了克服上述缺陷,可以采用以某個基本文本/語音映射表為基礎(chǔ)來調(diào)整個別發(fā)音因素的方法生成該規(guī)定聯(lián)系人的文本/語音映射表。下面,結(jié)合圖5說明本發(fā)明的另一個優(yōu)選實(shí)施方式。
[0047]圖5是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,一個優(yōu)選實(shí)施例的流程圖。在本實(shí)施例中,在服務(wù)器中預(yù)先存儲有多個已經(jīng)覆蓋了一定程度的發(fā)音音素的基本文本/語音映射表。但事實(shí)上例如在終端設(shè)備生成文本/語音映射表時(shí),也可以在終端設(shè)備中存儲上述多個基本文本/語音映射表。在本實(shí)施例的說明中,以服務(wù)器上存儲有分別具有1.較粗的男聲、2.較細(xì)的男聲、3.較粗的女聲、4.較細(xì)的女聲的四種發(fā)音音素的四個基本文本/語音映射表為例進(jìn)行說明。但事實(shí)上不限于此,可以根據(jù)不同的聲音特征進(jìn)行更詳細(xì)的分類和分級,從而存儲更多的基本文本/語音映射表。
[0048]首先,選擇與規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的基本文本/語音映射表(步驟S51)。例如,當(dāng)規(guī)定聯(lián)系人為用戶的母親,并且通過分析母親的通話數(shù)據(jù)發(fā)現(xiàn)她的聲音較細(xì)時(shí),選擇較細(xì)的女聲的基本文本/語音映射表。當(dāng)規(guī)定聯(lián)系人為用戶的父親,并且通過分析父親的通話數(shù)據(jù)發(fā)現(xiàn)他的聲音較粗時(shí),選擇較粗的男聲的基本文本/語音映射表。
[0049]其次,獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)(步驟S52)。
[0050]最后,根據(jù)上述所獲取的通話數(shù)據(jù)來調(diào)整所選擇的基本文本/語音映射表(步驟S53)。具體而言,對所獲取的通話數(shù)據(jù)進(jìn)行解析、并且分解為多個發(fā)音音素,以該分解出來的發(fā)音音素來替換或者調(diào)整所選擇的基本文本/語音映射表中的發(fā)音音素,不斷優(yōu)化該基本文本/語音映射表,從而生成規(guī)定聯(lián)系人的文本/語音映射表。
[0051]根據(jù)上述方法,由于是通過在已經(jīng)具有了相似的發(fā)音音素的基本文本/語音映射表的基礎(chǔ)上進(jìn)行調(diào)整來生成規(guī)定聯(lián)系人的文本/語音映射表,與傳統(tǒng)方法相比只需少量的通話數(shù)據(jù)即可生成與規(guī)定聯(lián)系人的聲音相似度較高的文本/語音映射表,大大提高了生成的效率和開銷。
[0052]然而,就終端設(shè)備的短信或者電子郵件的朗讀功能而言,在朗讀短信或者電子郵件的內(nèi)容之前,需要告知發(fā)信人的姓名或者電話號碼,否則用戶如果不看屏幕內(nèi)容則無法知道該短信或者電子郵件來自哪一個聯(lián)系人。當(dāng)用戶因某種原因沒有聽到聯(lián)系人的告知時(shí),還需要查看手機(jī)的顯示屏以確認(rèn)發(fā)信人的信息,給用戶帶來極大的不便。
[0053]為此,可以在終端設(shè)備中存儲多個分別對應(yīng)于不同規(guī)定聯(lián)系人的文本/語音映射表。圖6是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的示意圖。如圖6所示,例如當(dāng)由父親的通話數(shù)據(jù)生成文本/語音映射表1、由母親的通話數(shù)據(jù)生成文本/語音映射表2、由愛人的通話數(shù)據(jù)生成文本/語音映射表3時(shí),文本數(shù)據(jù)使用文本/語音映射表I轉(zhuǎn)換可以得到父親的聲音的語音數(shù)據(jù),文本數(shù)據(jù)使用文本/語音映射表2轉(zhuǎn)換可以得到母親的聲音的語音數(shù)據(jù),文本數(shù)據(jù)使用文本/語音映射表3轉(zhuǎn)換可以得到愛人的聲音的語音數(shù)據(jù)。因此,聯(lián)系人與文本/語音映射表之間可以建立對應(yīng)關(guān)系,且終端設(shè)備當(dāng)中可以記錄該對應(yīng)關(guān)系。
[0054]下面,結(jié)合圖7說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的另一個優(yōu)選實(shí)施方式。圖7是用于說明本發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法中,使用多個文本/語音映射表時(shí)的一優(yōu)選實(shí)施例的流程圖。
[0055]首先,獲取文本數(shù)據(jù)(步驟S71)。此處的文本數(shù)據(jù)可以是但不限于短信、電子郵件等來自特定聯(lián)系人的信件。
[0056]其次,識別該文本數(shù)據(jù)的聯(lián)系人(步驟S72)。具體而言,智能手機(jī)可以根據(jù)短信的發(fā)信人的電話號碼或者電子郵件的發(fā)件人的郵箱地址,對電話簿、通信錄等進(jìn)行檢索,從而識別聯(lián)系人。
[0057]接下來,根據(jù)聯(lián)系人與文本/語音映射表之間的對應(yīng)關(guān)系,選擇與該聯(lián)系人對應(yīng)的文本/語音映射表(步驟S73)。
[0058]最后,使用該選擇的文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)(步驟S74),從而得到與短信的發(fā)信人或者電子郵件的發(fā)件人對應(yīng)的聲音的語音數(shù)據(jù)。
[0059]根據(jù)上述方法,關(guān)系密切的人的聲音不僅給用戶帶來的親近感,而且通過使用短信、電子郵件的來信人的聲音來朗讀短信、電子郵件,可以方便地讓用戶識別發(fā)信人。
[0060]然而,以上實(shí)施例說明了多個規(guī)定聯(lián)系人與多個文本/語音映射表之間一一對應(yīng)的例子,但事實(shí)上不限于此,也可以將聯(lián)系人分組為男性與女性,分別與男聲的文本/語音映射表以及女聲的文本/語音映射表相對應(yīng)。也可以是使用用戶通過手動的方式來選擇的特定文本/語音映射表,并使用該特定文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換等。
[0061]以上說明了本 發(fā)明的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法的多個實(shí)施例。顯然,本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi)可以對上述實(shí)施例作出各種組合、修改或者變形。本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0062]【終端設(shè)備】
[0063]下面,結(jié)合附圖來說明本發(fā)明的終端設(shè)備的【具體實(shí)施方式】。在以下說明中,主要以將智能手機(jī)中的短信內(nèi)容轉(zhuǎn)換為語音數(shù)據(jù)為例進(jìn)行說明,但事實(shí)上不限于此,終端設(shè)備還可以是PDA、平板電腦、電子閱讀器、車載導(dǎo)航等其他任何終端設(shè)備,轉(zhuǎn)換的文本數(shù)據(jù)也不限于短信內(nèi)容,還可以是電子郵件,新聞等任何形式的文本數(shù)據(jù)。因此,基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在未經(jīng)創(chuàng)造性勞動而能夠獲得的所有其他實(shí)施例都屬于本發(fā)明保護(hù)的范圍。
[0064]下面,結(jié)合圖8說明本發(fā)明的終端設(shè)備的結(jié)構(gòu)。圖8是用于說明本發(fā)明的終端設(shè)備的結(jié)構(gòu)的功能框圖。如圖8所示,本發(fā)明的終端設(shè)備100包括:
[0065]通話數(shù)據(jù)保存模塊101,配置來保存通話數(shù)據(jù);以及處理模塊102,配置來獲取文本數(shù)據(jù),并獲取使用文本/語音映射表從文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù),其中,所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成,所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。其中,通話數(shù)據(jù)保存模塊101可以是隨機(jī)訪問存儲器(RAM)、閃速存儲器以及其他任何存儲部件,處理模塊102可以是微處理器等處理部件。
[0066]文本數(shù)據(jù)與語音數(shù)據(jù)之間的轉(zhuǎn)換一般通過文本/語音映射表來實(shí)現(xiàn)。文本/語音映射表中存儲了字符或者字符串與發(fā)音音素之間的對應(yīng)關(guān)系。在終端設(shè)備獲取文本數(shù)據(jù)后,使用文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。具體而言,首先識別該文本數(shù)據(jù)中的字符或者字符串。其次通過文本/語音映射表檢索到與該字符以及字符串對應(yīng)的發(fā)音音素。最后對該發(fā)音音素進(jìn)行拼接、調(diào)整、優(yōu)化,從而轉(zhuǎn)換為與該文本數(shù)據(jù)對應(yīng)的語音數(shù)據(jù)??梢?,轉(zhuǎn)換出來的語音數(shù)據(jù)中的聲色、聲調(diào)、強(qiáng)弱等聲音取決于文本/語音映射表中存儲的發(fā)音音素。同一個文本數(shù)據(jù)可以通過不同的文本/語音映射表分別轉(zhuǎn)換為不同人的聲音的語音數(shù)據(jù)。本發(fā)明的實(shí)施例通過通話數(shù)據(jù)保存模塊101保存規(guī)定聯(lián)系人的通話數(shù)據(jù),并且處理模塊102使用從該聯(lián)系人的通話數(shù)據(jù)的集合生成規(guī)定聯(lián)系人的聲音的文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)到語音數(shù)據(jù)的轉(zhuǎn)換,因此能夠在通話過程中自動收集語音數(shù)據(jù),而無需規(guī)定聯(lián)系人為了生成文本/語音映射表而特意進(jìn)行錄制,就能方便地將文本數(shù)據(jù)轉(zhuǎn)換為規(guī)定聯(lián)系人的聲音的語音數(shù)據(jù)。
[0067]接下來,生成文本/語音映射表的一個優(yōu)選實(shí)施方式。在本實(shí)施例中,終端設(shè)備100還包括配置來與服務(wù)器進(jìn)行通信的通信模塊103。
[0068]首先,通話數(shù)據(jù)保存模塊101保存與規(guī)定聯(lián)系人的通話數(shù)據(jù)。在這里以電話的通話數(shù)據(jù)為例進(jìn)行說明,但需要指出的是,通話數(shù)據(jù)不僅包括電話的通話數(shù)據(jù),還可以包括通過微信(注冊商標(biāo))、LINE (注冊商標(biāo))等其他帶有語音通信功能的第三方應(yīng)用軟件的通話數(shù)據(jù)。這里的規(guī)定聯(lián)系人一般是關(guān)系親近的人,例如可以是親屬、愛人、或者特定的朋友。規(guī)定聯(lián)系人可以由用戶手動設(shè)定,也可以根據(jù)智能手機(jī)的通話記錄、短信記錄等通信記錄來確定,還可以根據(jù)智能手機(jī)的桌面圖像等圖片數(shù)據(jù)的來確定。根據(jù)通話記錄來確定規(guī)定聯(lián)系人,例如可以是通過識別在單位時(shí)間內(nèi)的通話次數(shù)或者通話時(shí)間超過一定閾值的聯(lián)系人來確定。根據(jù)短信記錄確定規(guī)定聯(lián)系人,例如可以是通過識別在單位時(shí)間內(nèi)短信次數(shù)或者短信內(nèi)容字?jǐn)?shù)超過一定閾值的聯(lián)系人來確定。根據(jù)智能手機(jī)的桌面圖像來確定,例如可以是通過桌面圖像的人臉識別,與電話簿中存儲的人臉進(jìn)行匹配,從而識別該聯(lián)系人。優(yōu)選地,智能手機(jī)還可以對通話數(shù)據(jù)進(jìn)行篩選,當(dāng)通話質(zhì)量或者置信度達(dá)不到一定程度時(shí),拋棄該通話數(shù)據(jù),以保證通話數(shù)據(jù)的準(zhǔn)確性。該篩選過程將在后面詳細(xì)敘述。
[0069]接下來,通信模塊103將所保存的通話數(shù)據(jù)發(fā)送至服務(wù)器。服務(wù)器可以是通過廣域網(wǎng)連接的遠(yuǎn)程服務(wù)器,也可以是通過局域網(wǎng)或者其他方式連接的近程服務(wù)器。智能手機(jī)可以積攢多個通話數(shù)據(jù),并且達(dá)到一定數(shù)量后一并發(fā)送至服務(wù)器,也可以是每當(dāng)保存一個通話數(shù)據(jù)就立即向該服務(wù)器發(fā)送該通話數(shù)據(jù),還可以是其他任何形式。服務(wù)器接收并存儲來自智能手機(jī)的規(guī)定聯(lián)系人的通話數(shù)據(jù),形成通話數(shù)據(jù)的集合。
[0070]接下來,服務(wù)器根據(jù)所存儲的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表。具體而言,對通話數(shù)據(jù)進(jìn)行解析、并且分解為各個發(fā)音音素,并與字符或者字符串建立對應(yīng)關(guān)系,從而生成文本/語音映射表。優(yōu)選地,為了保證轉(zhuǎn)換出來的語音數(shù)據(jù)的準(zhǔn)確性,還可以對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測,并且在覆蓋預(yù)定范圍的發(fā)音音素后生成文本/語音映射表。該檢測過程將在后面詳細(xì)敘述。
[0071]最后,服務(wù)器將生成的文本/語音映射表發(fā)送給通信模塊103,以供處理模塊102使用該生成的文本/語音映射表進(jìn)行文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換。
[0072]由于通常需要大量的通話數(shù)據(jù)來生成文本/語音映射表,因此在上述生成文本/語音映射表的優(yōu)選實(shí)施方式中,由服務(wù)器端存儲通話數(shù)據(jù),并根據(jù)規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表,從而能夠有效減少智能手機(jī)(終端設(shè)備100)的負(fù)載,提高轉(zhuǎn)換效率。當(dāng)然,本領(lǐng)域技術(shù)人員知道,上述生成文本/語音映射表的處理也可以在處理模塊102中進(jìn)行。
[0073]下面,詳細(xì)說明通話數(shù)據(jù)的篩選過程的一個優(yōu)選實(shí)施方式。
[0074]首先,處理模塊102獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0075]接下來,處理模塊102判斷該通話數(shù)據(jù)的信號噪音比是否大于第一閾值(此處例如為20dB),并且噪聲水平小于第二閾值(此處例如為45dB)。
[0076]當(dāng)信號噪音比大于20dB并且噪聲水平小于45dB時(shí),說明該通話數(shù)據(jù)的質(zhì)量較好,判斷為適宜作為生成文本/語音映射表的元素,因此處理模塊102結(jié)束篩選處理,即保存通話數(shù)據(jù)至數(shù)據(jù)保存模塊101。
[0077]當(dāng)信號噪音比小于20dB或者噪聲水平大于45dB時(shí),說明該通話數(shù)據(jù)的質(zhì)量較差,繼續(xù)分析通話數(shù)據(jù),判斷其置信度是否大于第三閾值(第三閾值取值范圍為O?1,此處例如為0.85)。
[0078]當(dāng)置信度大于0.85時(shí)(步驟S33,是),說明該通話數(shù)據(jù)的可識別性高,判斷為適宜作為生成文本/語音映射表的元素,因此處理模塊102結(jié)束篩選過程,即保存通話數(shù)據(jù)至數(shù)據(jù)保存模塊101。
[0079]當(dāng)置信度小于0.85時(shí)(步驟S33,否),說明該通話數(shù)據(jù)的可識別性低,判斷該通話數(shù)據(jù)不宜作為生成文本/語音映射表的元素,因此處理模塊102拋棄該通話數(shù)據(jù),結(jié)束篩選過程。
[0080]因此,通過上述通話數(shù)據(jù)的篩選過程,可以實(shí)現(xiàn):僅在在滿足下述至少一個條件時(shí),保存該通話數(shù)據(jù),作為生成文本/語音映射表的元素的規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合:
[0081](I)信號噪音比大于第一閾值并且噪聲水平小于第二閾值;
[0082](2)所述通話數(shù)據(jù)的置信度大于第三閾值。
[0083]需要指出,本領(lǐng)域技術(shù)人員知道,也可以是同時(shí)滿足上述兩個條件時(shí),保存該通話數(shù)據(jù)。
[0084]以上說明了在處理模塊102保存規(guī)定聯(lián)系人的通話數(shù)據(jù)之前進(jìn)行篩選的示例,但事實(shí)上不限于此,也可以在保存通話數(shù)據(jù)之后且生成文本/語音映射表之前進(jìn)行篩選。
[0085]通過上述篩選處理,能夠保證作為生成文本/語音映射表的元素的通話數(shù)據(jù)的通話質(zhì)量以及置信度,從而以保證了生成文本/語音映射表的準(zhǔn)確性。
[0086]下面,詳細(xì)說明對通話數(shù)據(jù)的集合覆蓋發(fā)音音素的程度進(jìn)行檢測的一個優(yōu)選實(shí)施方式。
[0087]首先,獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0088]接下來,判斷所存儲的通話數(shù)據(jù)的集合是否覆蓋預(yù)定范圍的發(fā)音音素。這里的覆蓋音素的范圍可以根據(jù)實(shí)際需要進(jìn)行設(shè)定。很顯然,覆蓋的發(fā)音音素范圍越大,生成的文本/語音映射表越完整,轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音就越接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0089]當(dāng)所存儲的通話數(shù)據(jù)的集合沒有覆蓋預(yù)定范圍的發(fā)音音素時(shí),說明該文本/語音映射表中的發(fā)音音素還不足以達(dá)到所要求的完整程度,因此暫不生成文本/語音映射表而再次獲取該規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0090]當(dāng)所存儲的通話數(shù)據(jù)的集合覆蓋預(yù)定范圍的發(fā)音音素時(shí),說明該文本/語音映射表中的發(fā)音音素已達(dá)到所要求的完整程度,因此生成文本/語音映射表。
[0091]需要說明的是,本領(lǐng)域技術(shù)人員知道,當(dāng)智能手機(jī)(終端設(shè)備100)通過通信模塊103將規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送給服務(wù)器,并在服務(wù)器存儲通話數(shù)據(jù)集合并生成文本/語音映射表時(shí),在服務(wù)器進(jìn)行上述檢測處理。當(dāng)在處理模塊102存儲通話數(shù)據(jù)的集合并生成文本/語音映射表時(shí),由處理模塊102進(jìn)行上述檢測處理。
[0092]通過上述檢測處理,能夠保證構(gòu)成文本/語音映射表中的發(fā)音音素的完整性,使得使用該文本/語音映射表轉(zhuǎn)換出來的語音數(shù)據(jù)的聲音更接近于規(guī)定聯(lián)系人的真實(shí)聲音。
[0093]然而,一般情況下需要積累大量且多樣的通話數(shù)據(jù),才能夠根據(jù)與規(guī)定聯(lián)系人之間的通話數(shù)據(jù)的集合來覆蓋比較完整的發(fā)音音素。因此,為了生成一個能夠模擬規(guī)定聯(lián)系人的聲音的文本/語音映射表往往需要很長時(shí)間。為了克服上述缺陷,可以采用以某個基本文本/語音映射表為基礎(chǔ)來調(diào)整個別發(fā)音因素的方法生成該規(guī)定聯(lián)系人的文本/語音映射表。
[0094]下面,說明本發(fā)明的另一個優(yōu)選實(shí)施方式。在本實(shí)施例中,在服務(wù)器中預(yù)先存儲有多個已經(jīng)覆蓋了一定程度的發(fā)音音素的基本文本/語音映射表。但事實(shí)上例如在終端設(shè)備生成文本/語音映射表時(shí),也可以在終端設(shè)備中存儲上述多個基本文本/語音映射表。在本實(shí)施例的說明中,以服務(wù)器上存儲有分別具有1.較粗的男聲、2.較細(xì)的男聲、3.較粗的女聲、4.較細(xì)的女聲的四種發(fā)音音素的四個基本文本/語音映射表為例進(jìn)行說明。但事實(shí)上不限于此,可以根據(jù)不同的聲音特征進(jìn)行更詳細(xì)的分類和分級,從而存儲更多的基本文本/語音映射表。
[0095]首先,選擇與規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的基本文本/語音映射表。例如,當(dāng)規(guī)定聯(lián)系人為用戶的母親,并且通過分析母親的通話數(shù)據(jù)發(fā)現(xiàn)她的聲音較細(xì)時(shí),選擇較細(xì)的女聲的基本文本/語音映射表。當(dāng)規(guī)定聯(lián)系人為用戶的父親,并且通過分析父親的通話數(shù)據(jù)發(fā)現(xiàn)他的聲音較粗時(shí),選擇較粗的男聲的基本文本/語音映射表。
[0096]其次,獲取規(guī)定聯(lián)系人的通話數(shù)據(jù)。
[0097]最后,根據(jù)上述所獲取的通話數(shù)據(jù)來調(diào)整所選擇的基本文本/語音映射表。具體而言,對所獲取的通話數(shù)據(jù)進(jìn)行解析、并且分解為多個發(fā)音音素,以該分解出來的發(fā)音音素來替換或者調(diào)整所選擇的基本文本/語音映射表中的發(fā)音音素,不斷優(yōu)化該基本文本/語音映射表,從而生成規(guī)定聯(lián)系人的文本/語音映射表。
[0098]由于是通過在已經(jīng)具有了相似的發(fā)音音素的基本文本/語音映射表的基礎(chǔ)上進(jìn)行調(diào)整來生成規(guī)定聯(lián)系人的文本/語音映射表,因此只需少量的通話數(shù)據(jù)即可生成與規(guī)定聯(lián)系人的聲音相似度較高的文本/語音映射表,大大提高了生成的效率和開銷。
[0099]然而,就終端設(shè)備100的短信或者電子郵件的朗讀功能而言,在朗讀短信或者電子郵件的內(nèi)容之前,需要告知發(fā)信人的姓名或者電話號碼,否則用戶如果不看屏幕內(nèi)容則無法知道該短信或者電子郵件來自哪一個聯(lián)系人。當(dāng)用戶因某種原因沒有聽到聯(lián)系人的告知時(shí),還需要查看手機(jī)的顯示屏以確認(rèn)發(fā)信人的信息,給用戶帶來極大的不便。
[0100]為此,在終端設(shè)備中還可以包括文本/語音映射表存儲模塊104,配置來存儲多個分別對應(yīng)于不同規(guī)定聯(lián)系人的文本/語音映射表。例如當(dāng)由父親的通話數(shù)據(jù)生成文本/語音映射表1、由母親的通話數(shù)據(jù)生成文本/語音映射表2、由愛人的通話數(shù)據(jù)生成文本/語音映射表3時(shí),文本數(shù)據(jù)使用文本/語音映射表I轉(zhuǎn)換可以得到父親的聲音的語音數(shù)據(jù),文本數(shù)據(jù)使用文本/語音映射表2轉(zhuǎn)換可以得到母親的聲音的語音數(shù)據(jù),文本數(shù)據(jù)使用文本/語音映射表3轉(zhuǎn)換可以得到愛人的聲音的語音數(shù)據(jù)。因此,可以在聯(lián)系人與文本/語音映射表之間建立對應(yīng)關(guān)系,且終端設(shè)備當(dāng)中可以記錄該對應(yīng)關(guān)系。
[0101]首先,獲取文本數(shù)據(jù)。此處的文本數(shù)據(jù)可以是但不限于短信、電子郵件等來自特定聯(lián)系人的信件。
[0102]其次,識別該文本數(shù)據(jù)的聯(lián)系人。具體而言,處理模塊102可以根據(jù)短信的發(fā)信人的電話號碼或者電子郵件的發(fā)件人的郵箱地址,對電話簿、通信錄等進(jìn)行檢索,從而識別聯(lián)系人。
[0103]接下來,根據(jù)聯(lián)系人與文本/語音映射表之間的對應(yīng)關(guān)系,選擇與該聯(lián)系人對應(yīng)的文本/語音映射表。
[0104]最后,處理模塊102使用該選擇的文本/語音映射表將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù),從而得到與短信的發(fā)信人或者電子郵件的發(fā)件人對應(yīng)的聲音的語音數(shù)據(jù)。
[0105]根據(jù)上述終端設(shè)備100,關(guān)系密切的人的聲音不僅給用戶帶來的親近感,而且通過使用短信、電子郵件的來信人的聲音來朗讀短信、電子郵件,可以方便地讓用戶識別發(fā)信人。
[0106]然而,以上實(shí)施例說明了多個規(guī)定聯(lián)系人與多個文本/語音映射表之間一一對應(yīng)的例子,但事實(shí)上不限于此,也可以將聯(lián)系人分組為男性與女性,分別與男聲的文本/語音映射表以及女聲的文本/語音映射表相對應(yīng)。也可以是使用用戶通過手動的方式來選擇的特定文本/語音映射表,并使用該特定文本/語音映射表來實(shí)現(xiàn)文本數(shù)據(jù)與語音數(shù)據(jù)的轉(zhuǎn)換等。
[0107]通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的硬件平臺的方式來實(shí)現(xiàn),當(dāng)然也可以全部通過硬件來實(shí)施。基于這樣的理解,本發(fā)明的技術(shù)方案對【背景技術(shù)】做出貢獻(xiàn)的全部或者部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè)備(可以是個人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0108]以上說明了本發(fā)明的終端設(shè)備的多個實(shí)施例。顯然,本領(lǐng)域技術(shù)人員在不脫離本發(fā)明的精神和范圍內(nèi)可以對上述實(shí)施例作出各種組合、修改或者變形。本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
【權(quán)利要求】
1.一種將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法,應(yīng)用于具有終端設(shè)備,包括: 獲取文本數(shù)據(jù);以及 使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù), 其中,所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成,所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
2.如權(quán)利要求1所述的將文本轉(zhuǎn)換為語音的方法,其中, 所述根據(jù)第一通話數(shù)據(jù)生成文本/語音映射表包括: 所述終端設(shè)備保存與規(guī)定聯(lián)系人的通話數(shù)據(jù); 所述終端設(shè)備將所述與規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送至服務(wù)器; 所述服務(wù)器根據(jù)所述與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成文本/語音映射表。
3.如權(quán)利要求1所述的將文本轉(zhuǎn)換為語音的方法,其中, 根據(jù)所述終端設(shè)備中的通信記錄或者圖片數(shù)據(jù)來確定所述規(guī)定聯(lián)系人。
4.如權(quán)利要求1所述的將文本轉(zhuǎn)換為語音的方法,其中, 所述第一通話數(shù)據(jù)為滿足以下條件中的至少一個條件的與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合: 信號噪音比大于第一閾值并且噪聲水平小于第二閾值; 所述通話數(shù)據(jù)的置信度大于第三閾值。
5.如權(quán)利要求2所述的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法,其中, 所述服務(wù)器中存儲有一個或者多個基本文本/語音映射表, 所述根據(jù)所述規(guī)定聯(lián)系人的通話數(shù)據(jù)生成文本/語音映射表包括: 所述服務(wù)器從所述一個或者多個基本文本/語音映射表中選擇與所述規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的第一基本文本/語音映射表; 所述服務(wù)器根據(jù)所述規(guī)定聯(lián)系人的通話數(shù)據(jù)來調(diào)整所述第一基本文本/語音映射表中的發(fā)音元素,從而生成文本/語音映射表。
6.如權(quán)利要求1至5中的任何一項(xiàng)所述的將文本轉(zhuǎn)換為語音的方法,其中, 當(dāng)所述第一通話數(shù)據(jù)覆蓋預(yù)定范圍的發(fā)音音素時(shí),根據(jù)所述第一通話數(shù)據(jù)生成文本/語音映射表。
7.如權(quán)利要求1所述的將文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)的方法,其中, 所述使用文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)包括: 使用從多個文本/語音映射表中選擇的特定文本/語音映射表將所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù), 所述多個文本/語音映射表分別根據(jù)不同的聯(lián)系人的通話數(shù)據(jù)而生成。
8.—種終端設(shè)備,包括: 通話數(shù)據(jù)保存模塊,配置來保存通話數(shù)據(jù);以及 處理模塊,配置來獲取文本數(shù)據(jù),并獲取使用文本/語音映射表從文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù), 其中,所述文本/語音映射表根據(jù)第一通話數(shù)據(jù)生成,所述第一通話數(shù)據(jù)為與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合。
9.如權(quán)利要求8所述的終端設(shè)備,其中,還包括通信模塊,配置來與服務(wù)器進(jìn)行通信, 所述通信模塊將所述通話數(shù)據(jù)保存模塊中保存的與規(guī)定聯(lián)系人的通話數(shù)據(jù)發(fā)送至服務(wù)器,并從所述服務(wù)器接收根據(jù)與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合生成的文本/語音映射表, 所述處理模塊使用所述文本/語音映射表從所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。
10.如權(quán)利要求8所述的終端設(shè)備,其中, 根據(jù)所述終端設(shè)備中的通信記錄或者圖片數(shù)據(jù)來確定所述規(guī)定聯(lián)系人。
11.如權(quán)利要求8所述的終端設(shè)備,其中, 所述第一通話數(shù)據(jù)為滿足以下條件中的至少一個條件的與規(guī)定聯(lián)系人的通話數(shù)據(jù)的集合: 信號噪音比大于第一閾值并且噪聲水平小于第二閾值; 所述通話數(shù)據(jù) 的置信度大于第三閾值。
12.如權(quán)利要求8所述的終端設(shè)備,其中, 所述服務(wù)器中存儲有一個或者多個基本文本/語音映射表, 所述服務(wù)器從所述一個或者多個基本文本/語音映射表中選擇與所述規(guī)定聯(lián)系人的通話數(shù)據(jù)中的語音最接近的第一基本文本/語音映射表, 所述服務(wù)器根據(jù)所述規(guī)定聯(lián)系人的通話數(shù)據(jù)來調(diào)整所述第一基本文本/語音映射表的發(fā)音元素,從而生成文本/語音映射表。
13.如權(quán)利要求8至12中的任何一項(xiàng)所述的將文本轉(zhuǎn)換為語音的方法,其中, 當(dāng)所述第一通話數(shù)據(jù)覆蓋預(yù)定范圍的發(fā)音音素時(shí),根據(jù)所述第一通話數(shù)據(jù)生成文本/語音映射表。
14.如權(quán)利要求8所述的終端設(shè)備,其中,還包括: 文本/語音映射表存儲模塊,配置來存儲多個文本/語音映射表,所述多個文本/語音映射表分別根據(jù)不同的聯(lián)系人的通話數(shù)據(jù)而生成, 所述處理模塊根據(jù)從所述多個文本/語音映射表選擇的特定文本/語音映射表將所述文本數(shù)據(jù)轉(zhuǎn)換為語音數(shù)據(jù)。
【文檔編號】G10L13/08GK103794206SQ201410061987
【公開日】2014年5月14日 申請日期:2014年2月24日 優(yōu)先權(quán)日:2014年2月24日
【發(fā)明者】戴海生 申請人:聯(lián)想(北京)有限公司