一種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng)。本發(fā)明提供的這種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng),由訓(xùn)練模塊、建模模塊和應(yīng)用端模塊組成。所述訓(xùn)練模塊通過(guò)對(duì)輸入的江淮語(yǔ)系訓(xùn)練語(yǔ)音以及對(duì)應(yīng)的語(yǔ)音文本進(jìn)行訓(xùn)練,通過(guò)所述建模模塊應(yīng)用隱馬爾可夫模型(HMM)的工具包進(jìn)行建模,并利用建立好的模型來(lái)完成所述應(yīng)用端模塊的設(shè)計(jì);需要轉(zhuǎn)換的語(yǔ)音信號(hào)直接送入所述應(yīng)用端模塊,由應(yīng)用端模塊進(jìn)行語(yǔ)音識(shí)別,并轉(zhuǎn)換成文本文檔。本系統(tǒng)在實(shí)現(xiàn)語(yǔ)音識(shí)別的基礎(chǔ)上,更加強(qiáng)化了對(duì)江淮大部分地區(qū)方言的識(shí)別。
【專利說(shuō)明】—種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng),涉及一種語(yǔ)音識(shí)別技術(shù),具體的說(shuō)是將江淮語(yǔ)系的語(yǔ)音識(shí)別加入到普通的語(yǔ)音識(shí)別系統(tǒng)中去從而實(shí)現(xiàn)更寬泛的語(yǔ)音識(shí)別。
【背景技術(shù)】
[0002]目前我國(guó)市場(chǎng)上所研發(fā)的語(yǔ)音識(shí)別系統(tǒng)多是基于普通話的識(shí)別,涉及到方言的相對(duì)較少,即使涉及到方言也是粵語(yǔ)或者閩南語(yǔ)這些相對(duì)有代表性的語(yǔ)音。
【發(fā)明內(nèi)容】
[0003]本發(fā)明為針對(duì)上述已有技術(shù)中存在的不足之處,提供一種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng),即在實(shí)現(xiàn)普通話識(shí)別的基礎(chǔ)上同時(shí)滿足對(duì)江淮語(yǔ)系語(yǔ)音的識(shí)別,以實(shí)現(xiàn)更寬泛的語(yǔ)音識(shí)別。其構(gòu)造方案如下:
[0004]1、一種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng),其特征在于,它包括訓(xùn)練模塊、建模模塊和應(yīng)用端模塊,所述建模模塊是訓(xùn)練模塊與應(yīng)用端模塊連接的橋梁,它們之間按照先訓(xùn)練(訓(xùn)練模塊)再建模(建模模塊)最后應(yīng)用(應(yīng)用端模塊)的順序進(jìn)行工作,上述各單元還有以下特征:
[0005](I)所述訓(xùn)練模塊,由訓(xùn)練語(yǔ)音、語(yǔ)音對(duì)應(yīng)的轉(zhuǎn)錄文本和訓(xùn)練工具組成,用于建立語(yǔ)音與文本之間的聯(lián)系,為建模準(zhǔn)備素材,訓(xùn)練語(yǔ)音由江淮語(yǔ)系語(yǔ)音和普通話語(yǔ)音兩部分組成,它們與轉(zhuǎn)錄文本之間采用多對(duì)一的方式即江淮語(yǔ)系的發(fā)音與普通話發(fā)音對(duì)應(yīng)同一個(gè)轉(zhuǎn)錄文本,由訓(xùn)練工具通過(guò)單音節(jié)綁定一建模一三音節(jié)綁定一建模多次訓(xùn)練找出語(yǔ)音與文本的對(duì)應(yīng)關(guān)系的規(guī)律。
[0006](2)所述建模模塊,通過(guò)訓(xùn)練模塊準(zhǔn)備的素材應(yīng)用隱馬爾可夫模型(HMM)的工具包并配合模糊音識(shí)別技術(shù)建立準(zhǔn)確合理的模型,所謂模糊音識(shí)別技術(shù)主要是指對(duì)江淮地區(qū)方言的一些發(fā)音進(jìn)行模糊處理,示例如下:
[0007]
c<=>ch zOzh sOsh IOn fOh jOd enOeng inking
[0008](3)所述應(yīng)用端模塊,由語(yǔ)音識(shí)別器和語(yǔ)境二次識(shí)別器組成,所述語(yǔ)音識(shí)別器根據(jù)建模模塊建立的模型來(lái)完成設(shè)計(jì),用于對(duì)送入語(yǔ)音的首次識(shí)別,所述語(yǔ)境二次識(shí)別器由大量的詞庫(kù)組成,將首次識(shí)別后的語(yǔ)音根據(jù)前后文的語(yǔ)境進(jìn)行二次識(shí)別,最后將識(shí)別的結(jié)果以文本的方式輸出。
[0009]本發(fā)明的有益效果:
[0010]由于江淮語(yǔ)系識(shí)別的加入,降低了系統(tǒng)對(duì)江淮地區(qū)使用者輸入語(yǔ)音普通話的要求,同時(shí)由于引入了語(yǔ)境二次識(shí)別器,更大大的提高了識(shí)別的準(zhǔn)確性。
【專利附圖】
【附圖說(shuō)明】[0011]圖1為本發(fā)明結(jié)構(gòu)示意圖。
[0012]圖中:1、訓(xùn)練模塊;2、建模模塊;3、應(yīng)用端模塊;4、江淮語(yǔ)系訓(xùn)練語(yǔ)音;5、普通話訓(xùn)練語(yǔ)音;6、轉(zhuǎn)錄文本;7、訓(xùn)練工具;8、語(yǔ)音識(shí)別器;9、語(yǔ)境二次識(shí)別器;10、語(yǔ)音輸入端;
11、文本輸出端。
【具體實(shí)施方式】
[0013]參見圖1,基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng),包括有語(yǔ)音采集單元1、訓(xùn)練模塊;2、建模模塊;3應(yīng)用端模塊。
[0014]訓(xùn)練模塊I由江淮語(yǔ)系訓(xùn)練語(yǔ)音4、普通話訓(xùn)練語(yǔ)音5、轉(zhuǎn)錄文本6和訓(xùn)練工具7組成,訓(xùn)練工具7即為計(jì)算機(jī)上運(yùn)行的軟件,而江淮語(yǔ)系訓(xùn)練語(yǔ)音4、普通話訓(xùn)練語(yǔ)音5和轉(zhuǎn)錄文本6也存儲(chǔ)在同一臺(tái)計(jì)算機(jī)上,由訓(xùn)練工具7同時(shí)將它們調(diào)用進(jìn)行多對(duì)一訓(xùn)練,通過(guò)單音節(jié)綁定一建模一三音節(jié)綁定一建模多次訓(xùn)練找出語(yǔ)音與文本的對(duì)應(yīng)關(guān)系的規(guī)律,為建模模塊2提供建模素材。
[0015]建模模塊2也即為計(jì)算機(jī)上運(yùn)行的軟件,通過(guò)對(duì)訓(xùn)練模塊I提供素材的讀取,應(yīng)用隱馬爾可夫模型(HMM)的工具包并配合模糊音識(shí)別技術(shù)建立準(zhǔn)確合理的模型,用以為應(yīng)用端模塊3設(shè)計(jì)語(yǔ)音識(shí)別器8。
[0016]應(yīng)用端模塊3由語(yǔ)音識(shí)別器8和語(yǔ)境二次識(shí)別器9組成,語(yǔ)音識(shí)別器8為根據(jù)建模模塊2提供的模型設(shè)計(jì)而成的,用于對(duì)語(yǔ)音進(jìn)行一次識(shí)別;語(yǔ)境二次識(shí)別器9由大量的詞庫(kù)組成,通過(guò)對(duì)一次語(yǔ)音識(shí)別后的文檔,根據(jù)前后文的意思再次進(jìn)行二次識(shí)別對(duì)識(shí)別的結(jié)果進(jìn)行最后確認(rèn)并輸出文本,
[0017]需要識(shí)別的語(yǔ)音由語(yǔ)音輸入端10輸入應(yīng)用端模塊3,首先由語(yǔ)音識(shí)別器8進(jìn)行一次識(shí)別,結(jié)果送入語(yǔ)境二次識(shí)別器9對(duì)應(yīng)前后文進(jìn)行二次識(shí)別,最后由文本輸出端11輸出文本文檔。
【權(quán)利要求】
1.一種基于江淮語(yǔ)系的語(yǔ)音識(shí)別系統(tǒng),其特征在于,它包括訓(xùn)練模塊、建模模塊和應(yīng)用端模塊,所述建模模塊是訓(xùn)練模塊與應(yīng)用端模塊連接的橋梁,它們之間按照先訓(xùn)練(訓(xùn)練模塊)再建模(建模模塊)最后應(yīng)用(應(yīng)用端模塊)的順序進(jìn)行工作,上述各單元還有以下特征: (1)所述訓(xùn)練模塊,由訓(xùn)練語(yǔ)音、語(yǔ)音對(duì)應(yīng)的轉(zhuǎn)錄文本和訓(xùn)練工具組成,用于建立語(yǔ)音與文本之間的聯(lián)系,為建模準(zhǔn)備素材,訓(xùn)練語(yǔ)音與文本之間采用多對(duì)一的方式即江淮語(yǔ)系的發(fā)音與普通話發(fā)音對(duì)應(yīng)同一個(gè)轉(zhuǎn)錄文本; (2)所述建模模塊,通過(guò)訓(xùn)練模塊準(zhǔn)備的素材應(yīng)用隱馬爾可夫模型(HMM)的工具包并配合模糊音識(shí)別技術(shù)建立準(zhǔn)確合理的模型; (3)所述應(yīng)用端模塊,由語(yǔ)音識(shí)別器和語(yǔ)境二次識(shí)別器組成,語(yǔ)音識(shí)別器根據(jù)建模模塊建立的模型來(lái)完成設(shè)計(jì),用于對(duì)送入語(yǔ)音的首次識(shí)別,語(yǔ)境二次識(shí)別器由大量的詞庫(kù)組成,將首次識(shí)別后的語(yǔ)音根據(jù)前后文的語(yǔ)境進(jìn)行二次識(shí)別。
【文檔編號(hào)】G10L15/06GK103839546SQ201410116258
【公開日】2014年6月4日 申請(qǐng)日期:2014年3月26日 優(yōu)先權(quán)日:2014年3月26日
【發(fā)明者】劉亞斌, 許林沖, 陳良 申請(qǐng)人:合肥新濤信息科技有限公司