63]可選地識別語音模塊320包括:匹配語音單元321和確定文字單元322。
[0064]其中,匹配語音單元321用于將字母語音在識別匹配基準(zhǔn)表中進(jìn)行匹配;確定文字單元322用于確定與字母語音匹配度最高的基礎(chǔ)字母語音,將該基礎(chǔ)字母語音對應(yīng)的基礎(chǔ)字母文字作為與字母語音對應(yīng)的字母文字。
[0065]可選地組成單詞模塊330包括:顯示單詞單元331和確定結(jié)果單元332。
[0066]其中,顯示單詞單元331用于將識別到的至少一個(gè)字母文字組成單詞進(jìn)行顯示;確定結(jié)果單元332用于如果獲取到用戶的確認(rèn)結(jié)果或用戶的語音停頓信號,則將當(dāng)前識別到的字母文字組成的單詞作為識別結(jié)果。
[0067]可選地組成單詞模塊330包括:待定單詞單元333和確定單詞單元334。
[0068]其中,待定單詞單元333用于將識別到的至少一個(gè)字母文字組成待定單詞;確定單詞單元334用于將待定單詞與單詞庫進(jìn)行匹配,以確定匹配度最高的單詞,作為識別結(jié)果O
[0069]本實(shí)施例提供的一種終端的語音識別裝置,通過采集語音模塊采集用戶輸入的字母語音,通過識別語音模塊對字母語音進(jìn)行識別以確定與該字母語音對應(yīng)的字母文字,再通過組成單詞模塊將識別到的至少一個(gè)字母文字組成單詞作為識別結(jié)果。由于用戶朗讀單個(gè)字母時(shí)通常不會出現(xiàn)發(fā)音不準(zhǔn)的問題,也可將不認(rèn)識或不確定發(fā)音或具有相同發(fā)音的單詞拆分成字母,因此本實(shí)施例采用逐字母語音采集并識別字母文字以組成單詞,提高了識別準(zhǔn)確率還提高了用戶的語音輸入體驗(yàn),使得用戶在終端上進(jìn)行查詢單詞等操作更加高效、便捷。
[0070]本發(fā)明實(shí)施例還提供了一種終端,該終端包括:上述所述的語音識別裝置。該終端為配置有麥克風(fēng)的電腦、手機(jī)等電子終端設(shè)備,語音識別裝置用于通過配置在終端中的麥克風(fēng)采集用戶輸入的字母語音。具體地,語音識別裝置的采集語音模塊用于通過配置在終端中的麥克風(fēng)采集用戶輸入的字母語音。
[0071]如上所述,語音識別裝置可配置在各種支持語音輸入單詞的PC或手機(jī)等終端的系統(tǒng)上,該終端通過麥克風(fēng)采集用戶輸入的字母語音,該語音識別裝置識別的語種可以包括所有由字母拼寫的語種。
[0072]具體地,以采用特定人語音識別技術(shù)的終端為例,用戶在該終端上語音輸入單詞的過程為(以輸入英語單詞為例):
[0073](I)配置在終端中的語音識別裝置引導(dǎo)用戶朗讀26個(gè)英文字母;
[0074](2)終端的系統(tǒng)記錄該用戶對每個(gè)字母的讀音,分析該用戶朗讀各字母的聲音特征,以建立識別匹配基準(zhǔn)表;
[0075](3)在用戶需要輸入英文單詞時(shí),用戶逐字母地拼讀出該單詞。如需要輸入“native”時(shí),用戶向終端麥克風(fēng)朗讀“η”、“a”、“t”、“ i ”、“V、“e,,;
[0076](4)終端的系統(tǒng)進(jìn)行特定人語音識別,以識別出用戶輸入的字母;
[0077](5)終端系統(tǒng)將用戶輸入的字母拼成英語單詞,作為最終的識別結(jié)果。
[0078]該終端中配置的語音識別裝置的優(yōu)勢在于,可針對不同用戶建立完備的識別匹配基準(zhǔn)表,進(jìn)而應(yīng)用特定人語音識別技術(shù),實(shí)現(xiàn)高準(zhǔn)確率的語音識別,提高語音輸入單詞的體驗(yàn);且只需要用戶會朗讀字母即可。
[0079]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這里所述的特定實(shí)施例,對本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
【主權(quán)項(xiàng)】
1.一種終端的語音識別方法,其特征在于,包括: 采集用戶輸入的字母語音; 對所述字母語音進(jìn)行識別,以確定與所述字母語音對應(yīng)的字母文字; 將識別到的至少一個(gè)所述字母文字組成單詞,作為識別結(jié)果。2.根據(jù)權(quán)利要求1所述的語音識別方法,其特征在于,采集用戶輸入的字母語音之前,還包括: 采集所述用戶輸入的所需語言中基礎(chǔ)字母文字對應(yīng)的基礎(chǔ)字母語音,將所述用戶的基礎(chǔ)字母語音作為識別所述語言中字母的識別匹配基準(zhǔn)表。3.根據(jù)權(quán)利要求2所述的語音識別方法,其特征在于,對所述字母語音進(jìn)行識別,以確定與所述字母語音對應(yīng)的字母文字包括: 將所述字母語音在所述識別匹配基準(zhǔn)表中進(jìn)行匹配; 確定與所述字母語音匹配度最高的基礎(chǔ)字母語音,將該基礎(chǔ)字母語音對應(yīng)的基礎(chǔ)字母文字作為與所述字母語音對應(yīng)的字母文字。4.根據(jù)權(quán)利要求1所述的語音識別方法,其特征在于,將識別到的至少一個(gè)所述字母文字組成單詞,作為識別結(jié)果包括: 將識別到的至少一個(gè)所述字母文字組成單詞進(jìn)行顯示; 如果獲取到用戶的確認(rèn)結(jié)果或用戶的語音停頓信號,則將當(dāng)前識別到的字母文字組成的單詞作為識別結(jié)果。5.根據(jù)權(quán)利要求1所述的語音識別方法,其特征在于,將識別到的至少一個(gè)所述字母文字組成單詞,作為識別結(jié)果包括: 將識別到的至少一個(gè)所述字母文字組成待定單詞; 將所述待定單詞與單詞庫進(jìn)行匹配,以確定匹配度最高的單詞,作為識別結(jié)果。6.一種終端的語音識別裝置,其特征在于,包括: 采集語音模塊,用于采集用戶輸入的字母語音; 識別語音模塊,用于對所述字母語音進(jìn)行識別,以確定與所述字母語音對應(yīng)的字母文字; 組成單詞模塊,用于將識別到的至少一個(gè)所述字母文字組成單詞,作為識別結(jié)果。7.根據(jù)權(quán)利要求6所述的語音識別裝置,其特征在于,所述語音識別裝置還包括: 建立基準(zhǔn)模塊,用于在采集用戶輸入的字母語音之前,采集所述用戶輸入的所需語言中基礎(chǔ)字母文字對應(yīng)的基礎(chǔ)字母語音,將所述用戶的基礎(chǔ)字母語音作為識別所述語言中字母的識別匹配基準(zhǔn)表。8.根據(jù)權(quán)利要求7所述的語音識別裝置,其特征在于,所述識別語音模塊包括: 匹配語音單元,用于將所述字母語音在所述識別匹配基準(zhǔn)表中進(jìn)行匹配; 確定文字單元,用于確定與所述字母語音匹配度最高的基礎(chǔ)字母語音,將該基礎(chǔ)字母語音對應(yīng)的基礎(chǔ)字母文字作為與所述字母語音對應(yīng)的字母文字。9.根據(jù)權(quán)利要求6所述的語音識別裝置,其特征在于,所述組成單詞模塊包括: 顯示單詞單元,用于將識別到的至少一個(gè)所述字母文字組成單詞進(jìn)行顯示; 確定結(jié)果單元,用于如果獲取到用戶的確認(rèn)結(jié)果或用戶的語音停頓信號,則將當(dāng)前識別到的字母文字組成的單詞作為識別結(jié)果。10.根據(jù)權(quán)利要求6所述的語音識別裝置,其特征在于,所述組成單詞模塊包括: 待定單詞單元,用于將識別到的至少一個(gè)所述字母文字組成待定單詞; 確定單詞單元,用于將所述待定單詞與單詞庫進(jìn)行匹配,以確定匹配度最高的單詞,作為識別結(jié)果。
【專利摘要】本發(fā)明實(shí)施例公開了一種終端的語音識別方法和裝置,該語音識別方法包括:采集用戶輸入的字母語音;對字母語音進(jìn)行識別,以確定與字母語音對應(yīng)的字母文字;將識別到的至少一個(gè)字母文字組成單詞,作為識別結(jié)果。本發(fā)明的終端上配置的語音識別裝置采用逐字母語音采集并識別字母文字以組成單詞的方法,提高了識別準(zhǔn)確率還提高了用戶的語音輸入體驗(yàn),使得用戶在終端上進(jìn)行查詢單詞等操作更加高效、便捷。
【IPC分類】G10L15/183
【公開號】CN105096945
【申請?zhí)枴緾N201510548212
【發(fā)明人】凌熙
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2015年11月25日
【申請日】2015年8月31日