本發(fā)明涉及智能機器人領域,尤其涉及一種更新噪聲數(shù)據(jù)庫的機器人語音識別方法及裝置。
背景技術:
隨著語音識別技術的迅速發(fā)展,其應用領域也及其廣泛。特別是在智能機器人領域,為了使機器人更貼合用戶需求、方便用戶的使用,將語音識別技術作為智能機器人中人機交互的首選手段。但是,在進行語音識別的過程中,仍然存在著識別效率低的問題。特別是針對家用機器人,其使用環(huán)境因用戶的不同而有所不同,在不同的使用環(huán)境下,其面臨的噪聲也不同。因此,如何在不同用戶環(huán)境下對不同的噪聲進行有效的處理,并提高語音識別的效率,成為目前亟待解決的問題。
技術實現(xiàn)要素:
鑒于上述問題,本申請記載了一種更新噪聲數(shù)據(jù)庫的機器人語音識別方法,所述方法包括步驟:
獲取用戶發(fā)出的目標語音信號;
將所述目標語音信號分別傳遞至服務器中的服務器識別單元以 及在所述機器人中的機器人識別單元;
所述服務器識別單元對所述目標語音信號進行識別處理以獲取服務器識別結(jié)果;
所述機器人識別單元對所述目標語音信號進行識別處理以獲取機器人識別結(jié)果;
其中,所述方法還包括步驟:
基于所述服務器識別結(jié)果和/或所述機器人識別結(jié)果以獲取最終識別結(jié)果,所述機器人根據(jù)所述最終識別結(jié)果啟動相應的功能模塊;
于所述功能模塊需要所述目標語音信號中的語音數(shù)據(jù)時,分別獲取所述服務器識別結(jié)果和所述機器人識別結(jié)果的語音相似度,并根據(jù)所述語音相似度從所述服務器識別結(jié)果或所述機器人識別結(jié)果中獲取所述語音數(shù)據(jù);
在獲取所述目標語音信號之后以及將所述目標語音信號分別傳遞至所述服務器識別單元和所述機器人識別單元之前,所述方法還包括步驟:
判斷所述目標語音信號中是否全部為噪聲;
若所述目標語音信號中僅存在所述噪聲,根據(jù)所述目標語音信號更新噪聲數(shù)據(jù)庫并不再進行識別處理;
若所述目標語音信號中不只存在所述噪聲,在所述噪聲數(shù)據(jù)庫中選擇對所述噪聲進行降噪處理的噪聲數(shù)據(jù),并根據(jù)所述噪聲數(shù)據(jù)對所述目標語音信號進行降噪處理后將所述目標語音信號分別傳送至所述服務器識別單元以及所述機器人識別單元中;
其中,根據(jù)所述目標語音信號更新所述噪聲數(shù)據(jù)庫的過程包括步驟:
將所述目標語音信號與所述噪聲數(shù)據(jù)庫中的所有噪聲數(shù)據(jù)進行比對以獲取所有的噪聲相似度;
與噪聲閾值進行比較,判斷是否所有的噪聲相似度均小于所述噪聲閾值;
若均小于,將所述目標語音信號存儲至所述噪聲數(shù)據(jù)庫中;
否則,不做任何處理。
較佳的,所述方法還包括:
當所述功能模塊不需要所述語音數(shù)據(jù)時,將所述服務器識別結(jié)果輸入至所述功能模塊以控制所述機器人完成相應的功能。
較佳的,所述獲取服務器識別結(jié)果的過程包括:
將請求獲取所述服務器識別結(jié)果的服務器請求信號發(fā)送至所述服務器中;以及
根據(jù)所述服務器請求信號,從所述服務器識別單元中接收所述服務器識別數(shù)據(jù)。
較佳的,所述方法還包括步驟:
測試獲取所述服務器和所述機器人之間的網(wǎng)絡通信狀態(tài);
若所述網(wǎng)絡通信狀態(tài)低于正常水平,則所述功能模塊從所述機器人識別單元中獲取所述計算機識別數(shù)據(jù)中的所述語音數(shù)據(jù);
若所述網(wǎng)絡通信狀態(tài)處于或高于正常水平,則執(zhí)行步驟分別獲取所述服務器識別結(jié)果和所述機器人識別結(jié)果的語音相似度。
較佳的,所述方法進一步包括:
將從所述服務器識別結(jié)果或所述機器人識別結(jié)果中獲取所述語音數(shù)據(jù)傳送至所述功能模塊中。
較佳的,獲取所述機器人識別結(jié)果的過程包括步驟:
所述機器人識別單元參考獲取所述服務器識別單元識別所述目標語音信號的數(shù)據(jù)庫以對所述目標語音信號進行識別處理。
本發(fā)明還提供了一種更新噪聲數(shù)據(jù)庫的機器人語音識別裝置,適用于上述提出的更新噪聲數(shù)據(jù)庫的機器人語音識別方法。
上述技術方案具有如下優(yōu)點或有益效果:本發(fā)明提出的更新噪聲數(shù)據(jù)庫的機器人語音識別方法及裝置,在通過相互補充的服務器識別單元和機器人識別單元的共同處理下而獲取最終識別結(jié)果的過程中,通過預定的算法選擇和使用具有高可靠性的語音識別結(jié)果作為最終識別結(jié)果,從而增強機器人的語音識別率。除此之外,為了保證數(shù)據(jù)信息的安全性,當在語音識別后所啟動的功能模塊需要語音數(shù)據(jù)時,可以選擇使用機器人識別單元獲取的機器人識別結(jié)果,來防止與語音數(shù)據(jù)相關聯(lián)的服務器識別結(jié)果在網(wǎng)絡傳輸中泄漏。最后,在網(wǎng)絡通信狀態(tài)出現(xiàn)故障或信號不佳期間,能夠自動忽略服務器識別結(jié)果,從而消除從處理單元接收服務器識別結(jié)果所需要的延遲,進而提高了識別效率。最后,在獲取目標語音信號之后,首先進行去噪處理,以提高識別準確率。另外,對于全部是噪聲的信號,將其判斷后添加至噪聲數(shù)據(jù)庫中,以豐富噪聲數(shù)據(jù),有利于提高后續(xù)識別過程中對信號的去噪效率。
附圖說明
參考所附附圖,以更加充分的描述本發(fā)明的實施例。然而,所附附圖僅用于說明和闡述,并不構(gòu)成對本發(fā)明范圍的限制。
圖1為本發(fā)明中更新噪聲數(shù)據(jù)庫的機器人語音識別方法的流程圖;
圖2為本發(fā)明中根據(jù)網(wǎng)絡通信狀態(tài)確定是否選擇服務器識別結(jié)果的流程示意圖;
圖3為本發(fā)明中服務器是否對目標語音信號進行處理的流程示意圖;
圖4為本發(fā)明中對目標語音信號進行更新去噪處理的流程示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
圖1是本實施例中機器人語音識別系統(tǒng)進行語音識別方法的流程圖。如圖1所示,通過麥克風獲取用戶的目標語音信號(步驟s11)。
接下來,執(zhí)行將接收到的語音提供給服務器識別單元和機器人識 別單元的處理(步驟s12)。麥克風通過傳送單元將目標語音信號發(fā)送到服務器中,并且由服務器識別單元對該信號進行識別處理(步驟s13);同時機器人識別單元對該信號進行識別處理(步驟s14)。但是在該過程中,網(wǎng)絡通信狀態(tài)會影響傳輸速率,所以在實際應用中可以根據(jù)網(wǎng)絡通信狀態(tài)阻止到服務器的語音傳輸。具體來說,若網(wǎng)絡通信狀態(tài)低于整成水平時,則不再將目標語音信號發(fā)送至服務器,僅將該目標語音信號傳送至機器人識別單元中進行識別處理。
然后,執(zhí)行通過服務器識別單元識別目標語音信號以獲取服務器識別結(jié)果(步驟s13)。在該過程中,處理單元可以從服務器中獲取服務器識別結(jié)果。這時,對網(wǎng)絡通信狀態(tài)進行判斷,以確定是否需要阻止來自于服務器的服務器識別結(jié)果。此外,執(zhí)行通過機器人識別單元識別目標語音信號以獲取獲取機器人識別結(jié)果。
在識別處理之后,執(zhí)行基于服務器識別結(jié)果和/或機器人識別結(jié)果(即兩者中的至少一個)來啟動與用戶的意圖相對應的功能模塊(步驟s15)。例如,在實際應用中,通過口語理解(slu)工作可以估計與用戶的意圖相對應的功能(每個功能模塊對應不同的功能)。slu工作指的是從語音識別的句子中提取有意義的信息以推斷用戶的意圖,主要是,提取諸如主要行為、言語動作、所命名的實體等的信息。在此,主要動作表示在用戶的說話中透露的用戶想要采取的特定行為,并且言語動作表示諸如人、地點、組織、時間等的關鍵字信息。
接下來,判斷功能模塊是否需要目標語言信號中的語音數(shù)據(jù)(步驟s16)(語音數(shù)據(jù)可以代表具體信息或動作信息,如天氣信息或啟 動窗簾、熱水器等動作)。例如,當用戶發(fā)出的目標語音信號需要獲知今天的天氣狀況時,這是需要計算服務器識別結(jié)果和機器人識別結(jié)果的語音相似度。這里,語音相似度能夠表示在相互比較的文本內(nèi)多個字符或者單詞彼此一致的比率。例如,當“1234”與“1236”相比較時,四個字符中的三個相同但是一個是不同的,因此這兩組數(shù)字的語音相似度可以被計算為75%。
執(zhí)行將計算的語音相似度與語音閾值進行比較的處理(步驟s17),并將語音相似度與語音閾值的大小進行比較(步驟s18)。當語音相似度小于語音閾值時,即服務器識別結(jié)果和機器人識別結(jié)果之間存在大的差異,這時從服務器識別結(jié)果和機器人識別結(jié)果中選擇服務器識別結(jié)果進行進一步處理(步驟s19)。簡言之,此時選擇服務器識別結(jié)果用于控制相應的功能模塊。
但是,當語音相似度等于或者大于語音閾值時,即服務器識別結(jié)果和機器人識別結(jié)果中存在小的差異,那么此時從服務器識別結(jié)果和機器人識別結(jié)果中選擇機器人識別結(jié)果進行進一步處理(步驟s20)。簡言之,此時選擇機器人識別結(jié)果用于控制相應的功能模塊。
另外,當估計的功能不需要語音數(shù)據(jù)時執(zhí)行忽略機器人識別結(jié)果的處理(步驟s21)。因此,服務器識別結(jié)果可以被用于執(zhí)行所估計的功能。
因此,在本實施例中,通過相互補充服務器識別單元和機器人識別單元獲得的語音識別結(jié)果中,通過預定的算法選擇和使用兩者中具有高可靠性的語音識別結(jié)果,從而增強機器人的語音識別效率。
另外,在本實施例中,如果在語音識別處理期間所對應啟動的功能模塊需要目標語音信號中的語音數(shù)據(jù)時,優(yōu)選的,選擇機器人識別結(jié)果作為處理對象,從而防止與語音數(shù)據(jù)相關聯(lián)的服務器識別結(jié)果在網(wǎng)絡傳輸中泄漏。
除此之外,能夠在網(wǎng)絡通信狀態(tài)不良期間忽略服務器識別單元處理后的語音識別結(jié)果,以消除從處理單元接收服務器識別結(jié)果所需要的延遲,從而增強語音識別的處理速度。
圖2是本實施例中根據(jù)網(wǎng)絡通信狀態(tài)確定是否選擇服務器識別結(jié)果的流程示意圖,圖3是本實施例中服務器是否對目標語音信號進行處理的流程示意圖。
如圖2所示,首先,要獲得服務器和機器人之間的網(wǎng)絡通信狀態(tài)(步驟s110)。在實際應用中,可以基于傳輸速度、數(shù)據(jù)分組損失率等獲得網(wǎng)絡通信狀態(tài)。然后,對網(wǎng)絡通信狀態(tài)是否較差進行判定(步驟s120),如果差,則阻止處理單元從服務器中接收數(shù)據(jù)服務器識別結(jié)果(步驟s130)。
如圖3所示,在將對于服務器識別結(jié)果的服務器請求信號發(fā)送到服務器后(步驟s210),用以從服務器接收服務器識別結(jié)果。
具體來說,首先要確定在預定的響應時間內(nèi)是否接收到服務器識別結(jié)果(步驟s220)。若沒有,則說明超時,那么此時取消數(shù)據(jù)服務器請求,即取消從服務器中獲取服務器識別結(jié)果的請求(步驟s230)。此時服務器終止服務器識別結(jié)果的生成和傳輸。
圖4是本實施例中,對目標語音信號進行去噪處理的流程示意 圖。具體來說,在獲取目標語音信號之后以及將目標語音信號分別傳遞至服務器識別單元和機器人識別單元之前,需要進行去噪處理。首先,要對目標語音信號中是全部為噪聲進行判斷(步驟s310),若目標語音信號中僅存在噪聲,根據(jù)目標語音信號更新噪聲數(shù)據(jù)庫并不再進行識別處理(步驟s320);若目標語音信號中不只存在噪聲,在噪聲數(shù)據(jù)庫中選擇對噪聲進行降噪處理的噪聲數(shù)據(jù),并根據(jù)噪聲數(shù)據(jù)對目標語音信號進行降噪處理后將目標語音信號分別傳送至數(shù)據(jù)服務器識別單元以及機器人識別單元中。即如果目標語音信號中僅存在噪聲,那么說明該目標語音信號無意義,則不需要對其繼續(xù)進行識別處理;如果目標語音信號中不止存在噪聲,那么就需要對其中的噪聲進行去噪處理,以提高識別的準確性。
圖4中給出了本實施例中更新噪聲數(shù)據(jù)庫的流程示意圖。如果目標語音信號中僅存在噪聲,那么首先將目標語音信號與噪聲數(shù)據(jù)庫中的所有噪聲數(shù)據(jù)進行比對以獲取所有的噪聲相似度(步驟s330),然后將該噪聲相似度與噪聲閾值進行比較,以判斷是否所有的噪聲相似度均小于噪聲閾值(步驟s340)。當所有噪聲相似度小于噪聲閾值時,將目標語音信號存儲至噪聲數(shù)據(jù)庫中(步驟s350)。即如果目標語音信號與噪聲數(shù)據(jù)庫中的噪聲數(shù)據(jù)的相關性均較小,則說明目標語音信號所代表的噪聲數(shù)據(jù)并不存在于噪聲數(shù)據(jù)庫中,因此將其添加至噪聲數(shù)據(jù)庫中,以豐富噪聲數(shù)據(jù)庫的噪聲數(shù)據(jù),從而提高后續(xù)的噪聲處理精準度。
在本實施例中,機器人識別單元可以參考服務器數(shù)據(jù)庫識別接收 到的語音,在該服務器數(shù)據(jù)庫中以語音數(shù)據(jù)指定信息域,并且機器人識別單元可以將語音識別結(jié)果傳輸?shù)娇刂颇K??刂颇K可以基于處理單元的最終識別結(jié)果來估計和執(zhí)行與用戶的意圖相對應的功能模塊。例如,當麥克風到從用戶接收到的目標語音信號為“打開電視機”時,控制模塊可以執(zhí)行相應的開啟電視機的功能模塊。
此外,本實施例還提供了一種更新噪聲數(shù)據(jù)庫的機器人語音識別裝置,所述裝置適用于上述提出的更新噪聲數(shù)據(jù)庫的機器人語音識別方法。
本實施例提出的更新噪聲數(shù)據(jù)庫的機器人語音識別方法及裝置,在通過相互補充的服務器識別單元和機器人識別單元的共同處理下而獲取最終識別結(jié)果的過程中,通過預定的算法選擇和使用具有高可靠性的語音識別結(jié)果作為最終識別結(jié)果,從而增強機器人的語音識別率。
除此之外,為了保證數(shù)據(jù)信息的安全性,當在語音識別后所啟動的功能模塊需要語音數(shù)據(jù)時,可以選擇使用機器人識別單元獲取的機器人識別結(jié)果,來防止與語音數(shù)據(jù)相關聯(lián)的服務器識別結(jié)果在網(wǎng)絡傳輸中泄漏。
最后,在網(wǎng)絡通信狀態(tài)出現(xiàn)故障或信號不佳期間,能夠自動忽略服務器識別結(jié)果,從而消除從處理單元接收服務器識別結(jié)果所需要的延遲,進而提高了識別效率。
根據(jù)上述實施例的配置和方法將不會以有限的方式應用于前述的機器人,并且每個實施例的全部或者部分可以被選擇性地組合,并 且被配置成對其進行各種修改。
對于本領域的技術人員而言,閱讀上述說明后,各種變化和修正無疑將顯而易見。因此,所附的權利要求書應看作是涵蓋本發(fā)明的真實意圖和范圍的全部變化和修正。在權利要求書范圍內(nèi)任何和所有等價的范圍與內(nèi)容,都應認為仍屬本發(fā)明的意圖和范圍內(nèi)。