專利名稱:一種基于語音的提示方法及終端設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音識別領(lǐng)域,尤其涉及一種基于語音的提示方法及終端設(shè)備。
背景技術(shù):
目前對語音的識別技術(shù)的應(yīng)用范圍還比較小,主要是停留在聲控的情況,在電話機、手機、語音記事本、語音智能玩具等中均有應(yīng)用,如在手機中的聲音撥號,聲音打開關(guān)閉文件軟件等對手機的聲控操作。在上述的對語音識別技術(shù)應(yīng)用中,發(fā)明人發(fā)現(xiàn)設(shè)備對于采集的語音信息,直接進行聲音匹配并進行相應(yīng)的控制,還沒有根據(jù)采集的語音來匹配相關(guān)信息來提示用戶的應(yīng)用,因此在語音識別的功能應(yīng)用上,發(fā)展的還不夠完善。
發(fā)明內(nèi)容
本發(fā)明的實施例提供一種基于語音的提示方法及終端設(shè)備,能夠根據(jù)語音信息匹配并顯示提示信息。為達(dá)到上述目的,本發(fā)明的實施例采用如下技術(shù)方案一方面,提供一種基于語音的提示方法,包括采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。一方面,提供一種終端設(shè)備,包括語音處理單元,用于采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;匹配提示單元,用于用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明的實施例提供的基于語音的提示方法及終端設(shè)備,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達(dá)到對用戶的提示起到抗忘記的功能, 相對現(xiàn)有技術(shù)中僅對語音進行聲控操作而言,達(dá)到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例提供的基于語音的提示方法流程示意圖;圖2為本發(fā)明另一實施例提供的基于語音的提示方法流程示意圖3為本發(fā)明實施例提供的終端設(shè)備結(jié)構(gòu)示意圖;圖4為本發(fā)明另一實施例提供的終端設(shè)備結(jié)構(gòu)示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明實施例提供的基于語音的提示方法,如圖1所示,包括S101、終端設(shè)備采集語音信息并獲得語音信息對應(yīng)的標(biāo)識符。S102、用該標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明的實施例提供的基于語音的提示方法,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達(dá)到對用戶的提示起到抗忘記的功能,達(dá)到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。本發(fā)明另一實施例提供的基于語音的提示方法,以手機作為終端設(shè)備為例進行說明,如圖2所示,包括S201、手機語音處理單元的語音采集子單元采集到來電者A打來電話的語音信息——記為第一語音信息,并將該第一語音信息存儲于手機的存儲單元中。本步驟中,是手機在通話過程中對來電者的語音信息進行采集,此外也可以是在手機處于空閑狀態(tài)時,手機用戶通過語音采集軟件對外界的語音信息有針對性的采集。S202、通過手機語音處理單元的數(shù)字轉(zhuǎn)換子單元將第一語音信息轉(zhuǎn)換為第一語音數(shù)字信號。S203、手機語音處理單元的編碼子單元根據(jù)第一語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識第一語音數(shù)字信號的唯一的第一標(biāo)識符。這里進行編碼的方式可以采用子帶編碼和統(tǒng)計編碼結(jié)合的方式進行編碼。其中,子帶編碼一般是同波形編碼結(jié)合使用,如G. 722(支持比特率為64,56和481cbpS多頻率語音編碼算法)使用的是 SB-ADPCM(sub-band adaptive difference pulse code modulation,子帶-自適應(yīng)差分脈沖編碼)技術(shù)。但子帶的劃分更多是對頻域系數(shù)的劃分, 這可以更好地利用低頻帶比高頻帶感覺重要的特點,故子帶編碼中,往往先要應(yīng)用某種變換方法得到頻域系數(shù),在G. 722. 1中使用MLTOmilti-Iink trunking,多鏈路聚合)變換, 系數(shù)劃分為 16 個子帶;MPEG (moving pictures experts group/mot in pictures experts group,動態(tài)圖像專家組)伴音中用FFT (fast fourier transformation,快速傅氏變換)或 MDCT (the modified discrete cosine transform改進離散余弦變換)變換,劃分的子帶多達(dá)32個。統(tǒng)計編碼在圖像編碼中大量應(yīng)用,但在語音編碼中出于對編碼器整體性能的考慮,如變長編碼易引起誤碼擴散等,很少使用。對存在統(tǒng)計冗余的信號來說,統(tǒng)計編碼確實可以大大提高編碼的效率,所以,近年來出現(xiàn)的音頻編碼算法中,統(tǒng)計編碼又重新得到了重視。MPEG伴音和G. 722. 1建議中采納了哈夫曼變長編碼。
S204、手機的存儲單元存儲該第一標(biāo)識符,手機的配置單元為該第一標(biāo)識符配置提示信息,并將提示信息存儲于存儲單元。這里為第一標(biāo)識符配置的提示信息可以包括文字信息、圖像信息、視頻信息、語音信息中的一種或幾種。具體的,可以將將步驟S201中儲于語音存儲單元的第一語音信息與第一標(biāo)識符相關(guān)聯(lián),作為第一標(biāo)識符對應(yīng)的提示信息。在本實施例中,假設(shè)對應(yīng)第一標(biāo)識符手機存儲配置有該來電者A的姓名、頭像、電話錄音等提示信息。S205、手機語音處理單元的語音采集子單元再次采集到打來電話的來電者A的語音信息——記為第二語音信息。將該第二語音信息存儲于手機的存儲單元中,當(dāng)然,此處存儲第二語音信息不是必須的步驟。S206、手機語音處理單元的數(shù)字轉(zhuǎn)換子單元將第二語音信息轉(zhuǎn)換為第二語音數(shù)字信號。S207、手機語音處理單元的編碼子單元根據(jù)第二語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識第二語音數(shù)字信號的唯一的第二標(biāo)識符。本步驟 S207的具體編碼過程可以參照步驟S203的說明。需要說明的是,在步驟S205中手機的存儲單元也可以對采集到的第二語音信息進行存儲,該過程與步驟S201相同。S208、手機的存儲單元存儲該第二標(biāo)識符,手機的配置單元為該第二標(biāo)識符存儲配置提示信息,并將提示信息存儲于存儲單元。S209、手機的匹配提示單元用第二標(biāo)識符與已存儲的各個標(biāo)識符相匹配,此時同屬來電者A的第一標(biāo)識符和第二標(biāo)識符匹配成功,手機向用戶提示第一標(biāo)識符對應(yīng)存儲的提示信息。此時,由于預(yù)先為第一標(biāo)識符存儲了來電者A的姓名、頭像、電話錄音,則用戶可以看到該來電者A的姓名信息、頭像圖片,以及聽到該來電者A的電話錄音,方面了用戶的使用。當(dāng)然這里已存儲的標(biāo)識符是包括第一標(biāo)識符的,如果沒有與第二標(biāo)識符相匹配, 即匹配不成功,則相當(dāng)于手機對該第二語音信息執(zhí)行對第一語音信息的處理過程,即重復(fù) S201 S204的過程,這樣便為下次的匹配準(zhǔn)備提示信息。本發(fā)明的實施例提供的基于語音的提示方法,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達(dá)到對用戶的提示起到抗忘記的功能,相對現(xiàn)有技術(shù)中僅對語音進行聲控操作而言,達(dá)到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。需要說明的是,本實施例中是以手機為例進行的明,但終端設(shè)備不限于此,終端設(shè)備還可以是門禁系統(tǒng),車載系統(tǒng)或其他手持電子設(shè)備等,其具體的功能實現(xiàn)過程與本實施例相同。例如,在門禁系統(tǒng)中當(dāng)語音匹配成功后能夠通過語音的標(biāo)識符來查詢門禁設(shè)備中保存的提示信息,并輸出該提示信息,其中這里的提示信息也可以是用戶在門禁中配置的日常事項備忘錄,用于門禁使用者進行指紋匹配開門的指紋圖像信息等,從而起到在開門的同時還能達(dá)到對該門禁使用者的提示作用從而起到抗忘記的功能。
本發(fā)明實施例提供的終端設(shè)備30,對應(yīng)上述方法實施例,且可用于上述方法實施例中,并執(zhí)行上述方法的各個步驟,具體步驟說明參照上述方法實施例。該終端設(shè)備30,如圖3所示,包括語音處理單元31和匹配提示單元32其中語音處理單元,用于采集語音信息并獲得語音信息對應(yīng)的標(biāo)識符。匹配提示單元,用于用標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明的實施例提供的終端設(shè)備,采集語音發(fā)出個體發(fā)出的語音信息后,獲取語音信息對應(yīng)的標(biāo)識符,若該標(biāo)識符與終端設(shè)備中預(yù)先存儲的標(biāo)示符匹配,則輸出預(yù)先存儲的標(biāo)示符對應(yīng)的提示信息,以達(dá)到對用戶的提示起到抗忘記的功能,相對現(xiàn)有技術(shù)中僅對語音進行聲控操作而言,達(dá)到了基于語音的信息提示作用,豐富了針對語音的各種人性化應(yīng)用。進一步的,語音處理單元31還包括語音采集子單元311、數(shù)字轉(zhuǎn)換子單元312和編碼子單元313。語音采集子單元311,用于采集語音信息。數(shù)字轉(zhuǎn)換子單元312,用于將語音采集子單元311采集的語音信息轉(zhuǎn)換為語音數(shù)
字信號。編碼子單元313,用于根據(jù)語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識語音數(shù)字信號的唯一的標(biāo)識符。進一步的,終端設(shè)備30還包括存儲單元33和配置單元;34。存儲單元33,用于存儲標(biāo)識符和標(biāo)識符對應(yīng)的提示信息。配置單元34,用于為存儲單元存儲的標(biāo)識符配置提示信息,并將提示信息存儲于存儲單元。需要說明的是存儲單元33,還用于存儲語音處理單元31采集的語音信息。配置單元34,還用于將存儲單元存儲的語音信息與根據(jù)語音信息得到的標(biāo)識符相關(guān)聯(lián),作為標(biāo)識符的提示信息。具體的,對于手機,語音處理單元31功能可以通過手機的麥克風(fēng)模塊和手機的 CPU模塊處理實現(xiàn),匹配提示單元32的可以通過手機的CPU模塊和手機的顯示模塊或揚聲器模塊配合處理實現(xiàn),存儲單元33的功能可以通過手機的存儲卡完成,配置單元34的功能可以通過手機的輸入模塊與CPU模塊處理實現(xiàn)。其中語音采集子單元311可以為手機的麥克風(fēng)模塊,數(shù)字轉(zhuǎn)換子單元312和編碼子單元313的功能為通過手機的CPU模塊處理實現(xiàn)。本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括R0M、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本發(fā)明的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)以所述權(quán)利要求的保護范圍為準(zhǔn)。
權(quán)利要求
1.一種基于語音的提示方法,其特征在于,包括 采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符包括采集語音信息,將所述語音信息轉(zhuǎn)換為語音數(shù)字信號;根據(jù)所述語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識所述語音數(shù)字信號的唯一的標(biāo)識符。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括 存儲所述標(biāo)識符,并為所述標(biāo)識符存儲配置提示信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括存儲采集的語音信息,并將所述語音信息與根據(jù)所述語音信息得到的標(biāo)識符相關(guān)聯(lián), 作為所述標(biāo)識符的提示信息。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述提示信息包括文字信息、圖像信息、 視頻信息、語音信息中的一種或幾種。
6.一種終端設(shè)備,其特征在于,包括語音處理單元,用于采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符; 匹配提示單元,用于用所述標(biāo)識符與預(yù)先存儲的標(biāo)識符進行匹配,若匹配成功,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。
7.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,所述語音處理單元包括 語音采集子單元,用于采集語音信息,數(shù)字轉(zhuǎn)換子單元,用于將所述語音采集子單元采集的語音信息轉(zhuǎn)換為語音數(shù)字信號; 編碼子單元,用于根據(jù)所述語音數(shù)字信號的音高或音色或音調(diào)提取特征數(shù)據(jù),進行抽象編碼,得到標(biāo)識所述語音數(shù)字信號的唯一的標(biāo)識符。
8.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,還包括 存儲單元,用于存儲所述標(biāo)識符和所述標(biāo)識符對應(yīng)的提示信息;配置單元,用于為所述存儲單元存儲的標(biāo)識符配置提示信息,并將所述提示信息存儲于所述存儲單元。
9.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,所述存儲單元,還用于存儲所述語音處理單元采集的語音信息; 所述配置單元,還用于將所述存儲單元存儲的所述語音信息與根據(jù)所述語音信息得到的標(biāo)識符相關(guān)聯(lián),作為所述標(biāo)識符的提示信息。
10.根據(jù)權(quán)利要求6所述的終端設(shè)備,其特征在于,所述提示信息包括文字信息、圖像信息、視頻信息、語音信息中的一種或幾種。
全文摘要
本發(fā)明實施例提供一種基于語音的提示方法及終端設(shè)備,涉及語音識別領(lǐng)域,能夠根據(jù)語音信息匹配并顯示提示信息。該方法包括采集語音信息并獲得所述語音信息對應(yīng)的標(biāo)識符;若所述標(biāo)識符與預(yù)先存儲的標(biāo)識符相匹配,則向用戶提示所述預(yù)先存儲的標(biāo)識符對應(yīng)的提示信息。本發(fā)明實施例應(yīng)用于語音識別。
文檔編號H04M1/725GK102546940SQ201110448619
公開日2012年7月4日 申請日期2011年12月28日 優(yōu)先權(quán)日2011年12月28日
發(fā)明者楊萌 申請人:華為終端有限公司