一種終端的語音識別方法和裝置的制造方法

文檔序號：9371989閱讀：495來源：國知局

一種終端的語音識別方法和裝置的制造方法
【技術領域】
[0001]本發(fā)明實施例涉及語音識別技術，尤其涉及一種終端的語音識別方法和裝置。
【背景技術】
[0002]隨著語音識別技術的發(fā)展，通過語音來輸入文字已經(jīng)成為PC端和移動手機端文字輸入的一種重要方式。然而，由于語音識別的準確率偏低，語音輸入的體驗并不理想。長期以來，語音輸入都未能成為主要的輸入方式，用戶一直倚重的還是鍵盤輸入。
[0003]以查單詞的軟件為例。目前市場上有若干查單詞的軟件，其中多數(shù)軟件支持語音輸入單詞，其語音識別過程為用戶對著PC端或手機端的麥克風朗讀該完整單詞，隨后軟件通過非特定人語音識別(Speaker Independent Automatic Speech Recognit1n)技術對用戶輸入的單詞語音進行識別，識別結果作為用戶輸入的內(nèi)容。然而這樣的識別準確率普遍較低，主要原因有:不同用戶的發(fā)音差異很大，用戶可能不知道單詞的正確發(fā)音而讀錯單詞，同樣發(fā)音可能對應不同的單詞，以及國內(nèi)的語音識別技術主要是針對中文進行準確率優(yōu)化，對外文則較少進行優(yōu)化。
[0004]由此可知，現(xiàn)有的語音輸入單詞技術進行語音識別的準確率低，當用戶不知道單詞的發(fā)音時，則不可能通過語音來輸入單詞，或者，當用戶自知其發(fā)音可能不準確時，就更傾向于使用鍵盤輸入，而避免使用語音輸入。因此用戶的輸入體驗也較差。

【發(fā)明內(nèi)容】

[0005]本發(fā)明實施例提供一種終端的語音識別方法和裝置，以解決現(xiàn)有技術中單詞語音識別準確率低、用戶輸入體驗較差的問題。
[0006]第一方面，本發(fā)明實施例提供了一種終端的語音識別方法，包括:
[0007]采集用戶輸入的字母語音；
[0008]對所述字母語音進行識別，以確定與所述字母語音對應的字母文字；
[0009]將識別到的至少一個所述字母文字組成單詞，作為識別結果。
[0010]第二方面，本發(fā)明實施例還提供了一種終端的語音識別裝置，包括:
[0011]采集語音模塊，用于采集用戶輸入的字母語音；
[0012]識別語音模塊，用于對所述字母語音進行識別，以確定與所述字母語音對應的字母文字；
[0013]組成單詞模塊，用于將識別到的至少一個所述字母文字組成單詞，作為識別結果。
[0014]本發(fā)明提供的一種終端的語音識別方法和裝置，通過采集用戶輸入的字母語音，對字母語音進行識別以確定與該字母語音對應的字母文字，再將識別到的至少一個字母文字組成單詞作為識別結果。由于用戶朗讀單個字母時通常不會出現(xiàn)發(fā)音不準的問題，也可將不認識或不確定發(fā)音或具有相同發(fā)音的單詞拆分成字母，因此本發(fā)明采用逐字母語音采集并識別字母文字以組成單詞的方法，提高了識別準確率還提高了用戶的語音輸入體驗，使得用戶在終端上進行查詢單詞等操作更加高效、便捷。
【附圖說明】
[0015]為了更清楚地說明本發(fā)明實施例中的技術方案，下面將對實施例描述中所需要使用的附圖做一簡單地介紹，顯而易見地，下面描述中的附圖是本發(fā)明的一些實施例，對于本領域普通技術人員來講，在不付出創(chuàng)造性勞動的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0016]圖1是本發(fā)明實施例一中提供的一種終端的語音識別方法的流程圖；
[0017]圖2是本發(fā)明實施例二中提供的一種終端的語音識別方法的流程圖；
[0018]圖3是本發(fā)明實施例三中提供的一種終端的語音識別裝置的示意圖。
【具體實施方式】
[0019]為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚，以下將參照本發(fā)明實施例中的附圖，通過實施方式清楚、完整地描述本發(fā)明的技術方案，顯然，所描述的實施例是本發(fā)明一部分實施例，而不是全部的實施例?；诒景l(fā)明中的實施例，本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。
[0020]實施例一
[0021]如圖1所示，為本發(fā)明實施例一中提供的一種終端的語音識別方法的流程圖。本實施例的技術方案適用于在終端上通過語音輸入以查詢單詞等情況。終端可以為任意支持語音輸入和識別的電子終端設備，典型的如手機、平板電腦等。該方法可以由語音識別裝置來執(zhí)行，該裝置可以采用軟件和/或硬件的方式實現(xiàn)，配置在終端中執(zhí)行。
[0022]本實施例提供的一種終端的語音識別方法包括如下:
[0023]S110、采集用戶輸入的字母語音。
[0024]對于由字母拼寫的語言(如英語、法語、泰語等)，其單詞內(nèi)包含的字母數(shù)量一般并不多，用戶朗讀字母時也通常不會出現(xiàn)發(fā)音不準的問題，以及用戶對于不認識或不確定發(fā)音的單詞也可以通過拆分為字母進行輸入。因此在本步驟中，用戶通過逐字母朗讀的方式來向終端的語音識別裝置輸入語音，則不會出現(xiàn)采集到用戶輸入錯誤單詞語音的情況，也不會出現(xiàn)用戶輸入單詞語音為相同發(fā)音單詞的情況。
[0025]上述操作中，終端的語音識別裝置通過逐個字母語音采集的方式獲取輸入語音，代替了現(xiàn)有技術中整體單詞語音采集的方式，便于用戶輸入不確定讀音單詞和具有相同讀音的單詞，兼容了不同用戶的發(fā)音問題，也便于語音識別裝置后續(xù)進行語音識別，使得語音識別裝置的語音采集準確率高于單詞語音采集的方式。
[0026]S120、對字母語音進行識別，以確定與字母語音對應的字母文字。
[0027]當終端的語音識別裝置采集到一個字母語音時，語音識別裝置立即對該字母語音進行識別，以確定與該字母語音對應的字母文字。當語音識別裝置順序采集用戶輸入的多個字母語音時，順序?qū)Χ鄠€字母語音進行識別，以確定用戶輸入的每一個字母語音的字母文字。
[0028]上述操作中，由于字母語音相對整體單詞語音簡單，因此采集準確率的提高使得語音識別裝置對字母語音的識別準確率高于對整體單詞語音的識別率，對字母語音的識別可確定單詞中每一個字母文字，提高了單詞識別準確率。
[0029]S130、將識別到的至少一個字母文字組成單詞，作為識別結果。
[0030]當用戶輸入完成一個單詞后，語音識別裝置將順序識別出的字母文字組成單詞，該單詞即為語音識別裝置根據(jù)用戶輸入的字母語音識別出的單詞，語音識別裝置將該組成的單詞作為識別結果供用戶進行后續(xù)操作。
[0031]本實施例提供的一種終端的語音識別方法，通過采集用戶輸入的字母語音，對字母語音進行識別以確定與該字母語音對應的字母文字，再將識別到的至少一個字母文字組成單詞作為識別結果。由于用戶朗讀單個字母時通常不會出現(xiàn)發(fā)音不準的問題，也可將不認識或不確定發(fā)音或具有相同發(fā)音的單詞拆分成字母，因此本實施例采用逐字母語音采集并識別字母文字以組成單詞，提高了識別準確率還提高了用戶的語音輸入體驗，使得用戶在終端上進行查詢單詞等操作更加高效、便捷。
[0032]實施例二
[0033]如圖2所示，為本發(fā)明實施例二中提供的一種終端的語音識別方法的流程圖。本實施例的技術方案適用于在終端上通過語音輸入以查詢單詞等情況。該方法可以由語音識別裝置來執(zhí)行，該裝置可以采用軟件和/或硬件的方式實現(xiàn)，配置在終端中執(zhí)行。
[0034]語音識別技術包括特定人語音識別技術和非特定人語音識別技術。不同用戶的發(fā)音方式不同，因此顯而易見的采用特定人語音識別技術對用戶輸入的字母語音進行識別的識別準確率高于非特定人語音識別技術的識別準確率。本實施例中終端的語音

完整全部詳細技術資料下載

當前第1頁1 2 3