專利名稱:語音合成系統(tǒng)及其語音合成方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音合成系統(tǒng)及其語音合成方法,特別是涉及一種用于手機(jī)的語音合成系統(tǒng)及其語音合成方法。
背景技術(shù):
語音合成用于將文本文件轉(zhuǎn)換成自然語音輸出,從而可以有效地幫助有視覺障礙的人閱讀文本信息,或者只是簡(jiǎn)單的用來增加文本文檔等的可讀性。早期的語音合成系統(tǒng)一般采用專用的芯片實(shí)現(xiàn),如德州儀器公司的TMS50C10/TMS50C57芯片以及皇家飛利浦公司的PH84H36芯片等,但是上述的芯片一般主要應(yīng)用于家用電器或兒童玩具中。而計(jì)算機(jī)或移動(dòng)終端等電子設(shè)備中的語音合成系統(tǒng)一般都是通過軟件的形式實(shí)現(xiàn)。所以現(xiàn)有的語音合成系統(tǒng)的實(shí)現(xiàn)形式多樣,各個(gè)廠家都具有自己定制的語音合成系統(tǒng),而且各個(gè)廠家的語音合成系統(tǒng)之間相互不兼容。從而限制了語音合成系統(tǒng)的應(yīng)用與發(fā)展。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是為了克服現(xiàn)有技術(shù)中的語音合成系統(tǒng)不兼容的缺陷,提供一種語音合成系統(tǒng)及其語音合成方法,通過一文件生成模塊來生成基于一系統(tǒng)平臺(tái)的執(zhí)行文件,從而使得語音合成系統(tǒng)可以適用于所述系統(tǒng)平臺(tái),因此所述語音合成系統(tǒng)可以兼容于不同的系統(tǒng)平臺(tái)。本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:本發(fā)明提供了一種語音合成系統(tǒng),其包括基于一系統(tǒng)平臺(tái)的一應(yīng)用模塊;一文件生成模塊,根據(jù)所述系統(tǒng)平臺(tái)生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述應(yīng)用模塊;所述應(yīng)用模塊還根據(jù)所述執(zhí)行文件生成一文本解析子模塊和一語音合成子模塊;一文本接口,用于讀入文本信息;一音頻接口,用于輸出音頻信息;其中所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信息,所述語音合成子模塊將所述語音信息合成為音頻信息,然后所述音頻接口輸出所述音頻信息。較佳地,所述語音合成系統(tǒng)還包括一打印接口,其中所述應(yīng)用模塊還用于將所述文本信息轉(zhuǎn)化為打印文本信息并輸出至所述打印接口。較佳地,所述應(yīng)用模塊為通信模塊。從而將所述語音合成系統(tǒng)與移動(dòng)終端結(jié)合,因而提高了用戶的使用體驗(yàn)。較佳地,所述文本接口和音頻接口分別包括串行通信接口、并行通信接口和無線通信接口中的至少一種。本發(fā)明還提供了如上述的語音合成系統(tǒng)的語音合成方法,其特點(diǎn)是所述語音合成方法包括以下步驟=Sltll、所述文件生成模塊生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述應(yīng)用模塊;s1(12、所述應(yīng)用模塊依據(jù)所述執(zhí)行文件生成文本解析子模塊和語音合成子模塊;s1(l3、文本接口從外部設(shè)備讀入文本信息,并發(fā)送至所述文本解析子模塊;S1(I4、所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信息;s1(l5、所述語音合成子模塊將所述語音信息合成為音頻信息;s1(16、所述音頻接口將所述音頻信息發(fā)送至外部設(shè)備。較佳地,所述語音合成系統(tǒng)還包括一打印接口,并且所述步驟Sltl3中還包括以下步驟:所述應(yīng)用模塊將所述文本信息轉(zhuǎn)化為打印文本信息并輸出至所述打印接口。本發(fā)明的積極進(jìn)步效果在于:本發(fā)明的語音合成系統(tǒng)通過所述文件生成模塊來生成基于一系統(tǒng)平臺(tái)的執(zhí)行文件,從而使得語音合成系統(tǒng)可以適用于所述系統(tǒng)平臺(tái)。因而針對(duì)于不同的系統(tǒng)平臺(tái),本發(fā)明的語音合成系統(tǒng)均可以生成使得所述應(yīng)用模塊進(jìn)行語音合成工作的執(zhí)行文件。而且本發(fā)明中還通過應(yīng)用模塊和打印接口將接收到的文本信息打印出來,便于用戶的查閱。此外通過采用移動(dòng)終端中的通信模塊作為所述應(yīng)用模塊,將所述語音合成系統(tǒng)加入移動(dòng)終端中,從而來語音輸出移動(dòng)終端所接收的文本信息,因而提高了移動(dòng)終端的用戶使用體驗(yàn)。
圖1為本發(fā)明的語音合成系統(tǒng)的第一實(shí)施例的模塊結(jié)構(gòu)圖。圖2為本發(fā)明的語音合成系統(tǒng)的第一實(shí)施例的流程圖。圖3為本發(fā)明的語音合成系統(tǒng)的第二實(shí)施例的模塊結(jié)構(gòu)圖。圖4為本發(fā)明的語音合成系統(tǒng)的第二實(shí)施例的流程圖。
具體實(shí)施例方式下面結(jié)合附圖給出本發(fā)明較佳實(shí)施例,以詳細(xì)說明本發(fā)明的技術(shù)方案。第一實(shí)施例:如圖1所示,本實(shí)施的語音合成系統(tǒng)中包括一文件生成模塊1、一通信模塊2、一文本接口 3以及一音頻接口 4。其中本實(shí)施例的所述通信模塊2用于移動(dòng)終端中,并且基于一 MTK (MediaTek,聯(lián)發(fā)科)系統(tǒng)平臺(tái)。此外所述通信模塊2還可以根據(jù)移動(dòng)終端的實(shí)際配置和需要采用其他不同的系統(tǒng)平臺(tái)。因此本實(shí)施例中將語音合成系統(tǒng)結(jié)合至所述移動(dòng)終端中,從而可以提高移動(dòng)終端用戶的使用體驗(yàn)。但是用戶還可以采用其他設(shè)備中的其他模塊或單元取代本實(shí)施例中的通信模塊2,從而用戶可以在其他設(shè)備中結(jié)合語音合成系統(tǒng)。所述文件生成模塊I依據(jù)所述通信模塊2的MTK系統(tǒng)平臺(tái)的架構(gòu),生成適用于所述MTK系統(tǒng)平臺(tái)的用于執(zhí)行語音合成的執(zhí)行文件,然后將所述執(zhí)行文件燒錄至所述通信模塊2中。而且所述文件生成模塊I可以根據(jù)近所述通信模塊2的不同的系統(tǒng)平臺(tái)架構(gòu),生成適用于不同系統(tǒng)平臺(tái)的執(zhí)行文件。此外若用戶在其他設(shè)備中結(jié)合語音合成系統(tǒng)時(shí),所述文件生成模塊I也可以依據(jù)所述其他設(shè)備中單元或模塊所采用的系統(tǒng)平臺(tái)的結(jié)構(gòu)生成適用于所述系統(tǒng)平臺(tái)的執(zhí)行文件。所以本實(shí)施例的語音合成系統(tǒng)可以適用于不同的系統(tǒng)平臺(tái),從而具有很好的兼容性。所述通信模塊2根據(jù)所述執(zhí)行文件生成一文本解析子模塊21和一語音合成子模塊22。即所述執(zhí)行文件依據(jù)所述通信模塊2的MTK系統(tǒng)平臺(tái)架構(gòu),在所述通信模塊2中構(gòu)成出適用于所述通信模塊2的文本解析子模塊21和語音合成子模塊22來完成語音合成功倉泛。此時(shí)的所述文本解析子模塊21用于將文本信息中所有的詞匯都轉(zhuǎn)化為語音信息,即所述文本解析子模塊21將所述文本信息中所有語句中的各個(gè)詞匯轉(zhuǎn)化為與所述各個(gè)詞匯對(duì)應(yīng)的語音信息。所述語音合成子模塊22將文本信息中所有詞匯的語音信息合成為音頻信息,即將所述文本信息中所有詞匯的語音信息按照詞匯在文本信息中排列順序進(jìn)行排列,并按照文本信息中語句的劃分和韻律來組合所述語音信息,從而生成便于用戶識(shí)別和理解的語音信息。本實(shí)施例的文本接口 3用于從外部的設(shè)備或系統(tǒng)中讀入文本信息,其中本實(shí)施例總所述文本接口 3可以采用串行通信接口、并行通信接口甚至無線通信接口來實(shí)現(xiàn)文本信息的接收,例如USB(通用串行總線)、紅外接口或藍(lán)牙接口等。所述音頻接口 4將所述音頻信息發(fā)送至外部的設(shè)備或系統(tǒng)中。本實(shí)施例的語音合成系統(tǒng)的工作流程如圖2所示,其中包括以下步驟:步驟101,所述文件生成模塊I生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述通信模塊2。步驟102,所述通信模塊2依據(jù)所述執(zhí)行文件生成文本解析子模塊21和語音合成子模塊22。步驟103,文本接口 3從外部設(shè)備讀入文本信息,并發(fā)送至所述文本解析子模塊21。步驟104,所述文本解析子模塊21將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信
肩、O步驟105,所述語音合成子模塊22將所述語音信息合成為音頻信息。步驟106,所述音頻接口 4將所述音頻信息發(fā)送至外部設(shè)備。本實(shí)施例的語音合成系統(tǒng)通過與移動(dòng)終端的結(jié)合,從而來語音輸出移動(dòng)終端所接收的文本信息,因而提高了移動(dòng)終端的用戶使用體驗(yàn)。第二實(shí)施例:如圖3所示,本實(shí)施例的語音合成系統(tǒng)與第一實(shí)施例的區(qū)別在于:本實(shí)施例的語音合成系統(tǒng)中還包括一打印接口 5,其中本實(shí)施例的通信模塊2將所述文本接口 3接收的文本信息轉(zhuǎn)化為打印文本信息,并通過所述打印接口 5輸出至外部打印設(shè)備或系統(tǒng)中。本實(shí)施例的語音合成系統(tǒng)的工作流程如圖4所示,其中包括以下步驟:步驟201,所述文件生成模塊I生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述通信模塊2。
步驟202,所述通信模塊2依據(jù)所述執(zhí)行文件生成文本解析子模塊21和語音合成子模塊22。步驟203,文本接口 3從外部設(shè)備讀入文本信息,并發(fā)送至所述文本解析子模塊21。步驟204,所述通信模塊2將所述文本信息轉(zhuǎn)化為打印文本信息并通過所述打印接口 5輸出至外部打印設(shè)備或打印系統(tǒng)中。步驟205,所述文本解析子模塊21將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信
肩、O步驟206,所述語音合成子模塊22將所述語音信息合成為音頻信息。步驟207,所述音頻接口 4將所述音頻信息發(fā)送至外部設(shè)備。本實(shí)施例的語音合成系統(tǒng)通過通信模塊2和打印接口 5將接收到的文本信息打印出來,便于用戶的查閱。雖然以上描述了本發(fā)明的具體實(shí)施方式
,但是本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,這些僅是舉例說明,本發(fā)明的保護(hù)范圍是由所附權(quán)利要求書限定的。本領(lǐng)域的技術(shù)人員在不背離本發(fā)明的原理和實(shí)質(zhì)的前提下,可以對(duì)這些實(shí)施方式做出多種變更或修改,但這些變更和修改均落入本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種語音合成系統(tǒng),其包括: 基于一系統(tǒng)平臺(tái)的一應(yīng)用模塊; 一文件生成模塊,根據(jù)所述系統(tǒng)平臺(tái)生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述應(yīng)用模塊; 所述應(yīng)用模塊還根據(jù)所述執(zhí)行文件生成一文本解析子模塊和一語音合成子模塊; 一文本接口,用于讀入文本信息; 以及一音頻接口,用于輸出音頻信息; 其中所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信息,所述語音合成子模塊將所述語音信息合成為音頻信息,然后所述音頻接口輸出所述音頻信息。
2.按權(quán)利要求1所述的語音合成系統(tǒng),其特征在于,所述語音合成系統(tǒng)還包括一打印接口,其中所述應(yīng)用模塊還用于將所述文本信息轉(zhuǎn)化為打印文本信息并輸出至所述打印接□。
3.按權(quán)利要求1或2所述的語音合成系統(tǒng),其特征在于,所述應(yīng)用模塊為通信模塊。
4.按權(quán)利要求3所述的語音合成系統(tǒng),其特征在于,所述文本接口和音頻接口分別包括串行通信接口、并行通信接口和無線 通信接口中的至少一種。
5.按權(quán)利要求1所述的語音合成系統(tǒng)的語音合成方法,其特征在于,所述語音合成方法包括以下步驟: Sltll、所述文件生成模塊生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述應(yīng)用模塊; Sltl2、所述應(yīng)用模塊依據(jù)所述執(zhí)行文件生成文本解析子模塊和語音合成子模塊; Sic 、文本接口從外部設(shè)備讀入文本信息,并發(fā)送至所述文本解析子模塊; Sltl4、所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信息; Sltl5、所述語音合成子模塊將所述語音信息合成為音頻信息; Sltl6、所述音頻接口將所述音頻信息發(fā)送至外部設(shè)備。
6.按權(quán)利要求5所述的語音合成方法,其特征在于,所述語音合成系統(tǒng)還包括一打印接口,并且所述步驟Sltl3中還包括以下步驟: 所述應(yīng)用模塊將所述文本信息轉(zhuǎn)化為打印文本信息并輸出至所述打印接口。
全文摘要
本發(fā)明公開了一種語音合成系統(tǒng)及其語音合成方法,其包括基于一系統(tǒng)平臺(tái)的一應(yīng)用模塊;一文件生成模塊,根據(jù)所述系統(tǒng)平臺(tái)生成用于執(zhí)行語音合成的執(zhí)行文件,并將所述執(zhí)行文件燒錄至所述應(yīng)用模塊;所述應(yīng)用模塊還根據(jù)所述執(zhí)行文件生成一文本解析子模塊和一語音合成子模塊;一文本接口,用于讀入文本信息;一音頻接口,用于輸出音頻信息;其中所述文本解析子模塊將文本信息中的所有詞匯分別轉(zhuǎn)化為語音信息,所述語音合成子模塊將所述語音信息合成為音頻信息,然后所述音頻接口輸出所述音頻信息。本發(fā)明的語音合成系統(tǒng)通過所述文件生成模塊來生成基于一系統(tǒng)平臺(tái)的執(zhí)行文件,從而使得語音合成系統(tǒng)可以適用于所述系統(tǒng)平臺(tái),提高了用戶使用體驗(yàn)。
文檔編號(hào)G10L13/08GK103093751SQ20111033492
公開日2013年5月8日 申請(qǐng)日期2011年10月28日 優(yōu)先權(quán)日2011年10月28日
發(fā)明者徐源 申請(qǐng)人:上海移遠(yuǎn)通信技術(shù)有限公司