用于識別語音的裝置和方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種用于識別語音的裝置和方法,更特別涉及一種用于車輛的免提裝置等的語音識別裝置,以及通過根據(jù)駕駛者的位置來改變陣列式麥克風(fēng)的波束形成區(qū),從而能夠提高語音識別率的語音識別裝置和方法。
【背景技術(shù)】
[0002]用于識別駕駛者語音的普通裝置,例如車輛的免提裝置等,被實(shí)施為通過利用具有朝向駕駛者座椅方向的方向性的單麥克風(fēng),或者通過朝著駕駛者的座椅方向、用于波束形成的陣列式麥克風(fēng),使得包含在駕駛者語音中的噪聲的影響最小。
[0003]然而,由于駕駛者的語音通常是在未考慮駕駛者的坐高,駕駛者的位置等的狀態(tài)下獲得的,因此可能不足以提供高質(zhì)量的呼叫環(huán)境。
【發(fā)明內(nèi)容】
[0004]為了解決現(xiàn)有技術(shù)中出現(xiàn)的上述問題,同時(shí)保持現(xiàn)有技術(shù)具有的優(yōu)點(diǎn),而提出本發(fā)明。
[0005]本發(fā)明的一個(gè)方面提供一種語音識別裝置和方法,通過檢查駕駛者的座椅位置,并把陣列式麥克風(fēng)的波束形成區(qū)設(shè)定成檢查到的位置,從而能夠更精確地獲得駕駛者的語音數(shù)據(jù)。
[0006]根據(jù)本發(fā)明的示例性實(shí)施例,用于識別語音的裝置包括:多個(gè)被配置成具有至少一個(gè)麥克風(fēng)的陣列式麥克風(fēng);座椅控制器,被配置成檢查置于車輛中的座椅的位置;以及麥克風(fēng)控制器,被配置成基于檢查到的座椅的位置設(shè)定波束形成區(qū),并控制陣列式麥克風(fēng),以便從所設(shè)定的波束形成區(qū)獲得聲源數(shù)據(jù)。
[0007]麥克風(fēng)控制器將座椅的總移動距離識別成陣列式麥克風(fēng)的總波束形成角度。
[0008]麥克風(fēng)控制器將座椅的總移動距離等分成多個(gè)區(qū)間,并根據(jù)所分割的區(qū)間,將陣列式麥克風(fēng)的總波束形成角度等分成多個(gè)區(qū)間,從而形成第一波束形成區(qū)間。
[0009]麥克風(fēng)控制器可以將第一波束形成區(qū)間中與座椅位置相對應(yīng)的區(qū)間設(shè)定成第一波束形成區(qū)。
[0010]麥克風(fēng)控制器可以將第一波束形成區(qū)分成多個(gè)區(qū)間,從而產(chǎn)生多個(gè)第二波束形成區(qū)間。
[0011]麥克風(fēng)控制器可以控制第一陣列式麥克風(fēng)和第二陣列式麥克風(fēng),以便從多個(gè)第二波束形成區(qū)間獲得不同區(qū)間的聲源數(shù)據(jù)。
[0012]麥克風(fēng)控制器可以將從第一陣列式麥克風(fēng)和第二陣列式麥克風(fēng)獲得的聲源數(shù)據(jù)的信號中獲得的具有最大強(qiáng)度的信號的區(qū)間,設(shè)定成第二波束形成區(qū)。
[0013]該裝置還可以包括語音識別器,該語音識別器從自第二波束形成區(qū)獲得的聲源數(shù)據(jù)中提取語音數(shù)據(jù)。
[0014]根據(jù)本發(fā)明另一個(gè)實(shí)施例,用于識別語音的方法包括:在從外部收到用于進(jìn)入語音識別模式的信號時(shí),啟動多個(gè)陣列式麥克風(fēng);檢查置于車輛中的座椅的位置;基于所檢查到的座椅的位置,設(shè)定波束形成區(qū);從波束形成區(qū)獲得聲源數(shù)據(jù);以及從所獲得的聲源數(shù)據(jù)中提取語音數(shù)據(jù)。
[0015]檢查座椅位置的步驟可以包括:將座椅的總移動距離等分成多個(gè)區(qū)間,并檢查座椅是否位于經(jīng)劃分的區(qū)間的任意位置上。
[0016]設(shè)定波束形成區(qū)的步驟可以包括:通過將陣列式麥克風(fēng)的總波束形成角度劃分成等于通過劃分總移動距離而獲得的區(qū)間,形成第一波束形成區(qū)間;和將第一波束形成區(qū)間中與座椅位置相對應(yīng)的區(qū)間設(shè)定成第一波束形成區(qū)。
[0017]該方法還可以包括在將與座椅位置相對應(yīng)的區(qū)間設(shè)定成第一波束形成區(qū)的步驟之后,選擇第二波束形成區(qū)。
[0018]選擇所述第二波束形成區(qū)的步驟可以包括:將第一波束形成區(qū)劃分成多個(gè)區(qū)間;通過第一陣列式麥克風(fēng)和第二陣列式麥克風(fēng),從多個(gè)第二波束形成區(qū)間獲得不同區(qū)間的聲源數(shù)據(jù);將從第一陣列式麥克風(fēng)和第二陣列式麥克風(fēng)獲得的聲源數(shù)據(jù)信號的強(qiáng)度進(jìn)行比較;以及根據(jù)比較結(jié)果,選擇從中獲得具有最大強(qiáng)度信號的區(qū)間,作為第二波束形成區(qū)。
【附圖說明】
[0019]通過以下的詳細(xì)說明,并結(jié)合附圖,本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)將會更加顯而易見,其中:
[0020]圖1是表示根據(jù)本發(fā)明的示例性實(shí)施例的語音識別裝置的主要結(jié)構(gòu)的方框圖;
[0021]圖2是用來說明根據(jù)本發(fā)明的示例性實(shí)施例的語音識別方法的流程圖;
[0022]圖3-5示出根據(jù)本發(fā)明的示例性實(shí)施例的設(shè)定用于識別語音的陣列式麥克風(fēng)的波束形成區(qū)的方法。
【具體實(shí)施方式】
[0023]下面結(jié)合附圖,更詳細(xì)地說明本發(fā)明的示例性實(shí)施例。然而,在說明本發(fā)明的示例性實(shí)施例時(shí),如果可能的話,為本領(lǐng)域的技術(shù)人員眾所周知,并且不直接與本發(fā)明相關(guān)的技術(shù)內(nèi)容將被省略。這是為了通過省略不必要的說明,更清楚地講述本發(fā)明的要點(diǎn),以便不會模糊本發(fā)明。
[0024]圖1是示出根據(jù)本發(fā)明示例性實(shí)施例的語音識別裝置的主要結(jié)構(gòu)的方框圖。
[0025]參見圖1,語音識別裝置100可以包括通信器110、座椅開關(guān)120、座椅控制器130、座椅驅(qū)動器140、麥克風(fēng)控制器150、陣列式麥克風(fēng)160和語音識別器170。
[0026]通信器110執(zhí)行控制器局域網(wǎng)(CAN)通信,用于實(shí)現(xiàn)座椅控制器130與麥克風(fēng)控制器150之間的通信。
[0027]座椅開關(guān)120生成用于改變置于車輛中的座椅的位置的信號,并把該信號提供給座椅控制器130。
[0028]座椅控制器130根據(jù)從座椅開關(guān)120提供的信號,控制座椅驅(qū)動器140以改變座椅位置。座椅控制器130檢查車輛的當(dāng)前座椅位置信息,并將其提供給麥克風(fēng)控制器150。座椅控制器130將座椅的總移動距離等分成多個(gè)區(qū)間,并將多個(gè)區(qū)間中的、其中安置有座椅的區(qū)間的信息提供給麥克風(fēng)控制器150。
[0029]座椅驅(qū)動器140基于座椅控制器130的控制,改變座椅的位置。
[0030]麥克風(fēng)控制器150從外部接收用于進(jìn)入語音識別模式的信號,從而啟動陣列式麥克風(fēng)160。在這種情況下,可以通過獨(dú)立的輸入裝置(未示出)接收從外部接收的信號,語音識別模式可以是實(shí)現(xiàn)諸如免提服務(wù),利用語音識別的音頻、視頻和導(dǎo)航(AVN)控制服務(wù),利用語音識別的目的地設(shè)定服務(wù)之類功能的模式。
[0031]當(dāng)收到用于進(jìn)入語音識別模式的信號時(shí),麥克風(fēng)控制器150通過通信器110,向座椅控制器130請求置于車輛中的座椅的位置信息。麥克風(fēng)控制器150利用從座椅控制器130接收的信息,檢查座椅的位置。麥克風(fēng)控制器150基于檢查的當(dāng)前座椅位置,設(shè)定第一波束形成區(qū)。更具體地,麥克風(fēng)控制器150將座椅的總移動距離確定為陣列式麥克風(fēng)160的總波束形成區(qū)間。麥克風(fēng)控制器150將總波束形成區(qū)間劃分成與從座椅的總移動距離劃分的相等的區(qū)間。另外,麥克風(fēng)控制器150將與從座椅控制器130收到的、座椅置于其中的區(qū)間相對應(yīng)的波束形成區(qū)間,設(shè)定成第一波束形成區(qū)。
[0032]麥克風(fēng)控制器150將第一波束形成區(qū)劃分成具有相同角度的多個(gè)第二波束形成區(qū)間。麥克風(fēng)控制器150將第二波束形成區(qū)間中能夠更精確地獲得聲源信號的區(qū)間,確定成第二波束形成區(qū)。更具體地,麥克風(fēng)控制器150控制第一陣列式麥克風(fēng)161,以便獲得多個(gè)第二波束形成區(qū)間中的第一區(qū)間的聲源信號,并控制第二陣列式麥克風(fēng)162,以獲得多個(gè)第二波束形成區(qū)間中的第二區(qū)間的聲源信號。麥克風(fēng)控制器150將第一區(qū)間的聲源信號(第一信號)與第二區(qū)間的聲源信號(第二信號)彼此進(jìn)行比較,并將第一陣列式麥克風(fēng)161固定到具有較大信號強(qiáng)度的區(qū)間。在此情況下,當(dāng)?shù)谝恍盘柕碾娖酱笥诘诙盘柕碾娖綍r(shí),麥克風(fēng)控制器150將第一陣列式麥克風(fēng)161布置在第一區(qū)間中,并將第二陣列式麥克風(fēng)162移動到第三區(qū)間。如果第一信號的電平小于第二信號的電平,則麥克風(fēng)控制器150將第一陣列式麥克風(fēng)161移動到第二區(qū)間,并將第二陣列式麥克風(fēng)162移動到第三區(qū)間。因而,麥克風(fēng)控制器150在整個(gè)第二波束形成區(qū)間內(nèi),對分別從第一陣列式麥克風(fēng)161和第二陣列式麥克風(fēng)162獲得的聲源信號強(qiáng)度進(jìn)行比較。麥克風(fēng)控制器150將多個(gè)第二波束形成區(qū)間中的、其中檢查到聲源信號的最大強(qiáng)度的區(qū)間確定成第二波束形成區(qū),并將第一陣列式麥克風(fēng)161布置在該第二波束形成區(qū)中,從而獲得聲源信號。
[0033]另外,麥克風(fēng)控制器150將獲得的聲源信號提供給語音識別器170。因而,本發(fā)明通過基于駕駛者的位置,對能夠獲得陣列式麥克風(fēng)160的聲源信號的位置進(jìn)行改變,可以確保更精確的語音識別性能。
[0034]陣列式麥克風(fēng)160可包括第一陣列式麥克風(fēng)161和第二陣列式麥克風(fēng)162。第一陣列式麥克風(fēng)161可以是收集聲源數(shù)據(jù)的主麥克風(fēng),第二陣列式麥克風(fēng)162可以是用于分析聲源信號以確定從第一陣列式麥克風(fēng)161收集聲源數(shù)據(jù)的最佳區(qū)間的副麥克風(fēng)。
[0035]語音識別器170分析從麥克風(fēng)控制器150提供的聲源信號,從而提取語音數(shù)據(jù)。從語音識別器170提取的語音數(shù)據(jù)被用于免提服務(wù),利用語音識別的音頻、視頻和導(dǎo)航(AVN)控制服務(wù),利用語音識別的目的地設(shè)定服務(wù),等等。
[0036]圖2是用于說明根據(jù)本發(fā)明示例性實(shí)施例的語音識別方法的流程圖。圖3-5是用于說明根據(jù)本發(fā)明示例性實(shí)施例的用于識別語音的陣列式麥克風(fēng)的波束形成區(qū)的設(shè)定方法的圖示。
[0037]參見圖1-5,當(dāng)從外部接收到用于進(jìn)入語音識別模式的信號時(shí)(S11),麥克風(fēng)控制器150前進(jìn)到S13。在此情況下,可通過獨(dú)立的輸入裝置(未示出)接收來自外部的信號,并且語音識別模式可以是實(shí)現(xiàn)諸如免提服務(wù),利用語音識別的音頻、視頻和導(dǎo)航(AVN)控制服務(wù),以及利用語音識別的目的地設(shè)定服務(wù)等功能的模式。
[0038]麥克風(fēng)控制器150啟動第一陣列式麥克風(fēng)161和第二陣列式麥克風(fēng)162 (S13)。陣列式麥克風(fēng)160可以是由兩個(gè)麥克風(fēng)構(gòu)成的一個(gè)陣列式麥克風(fēng)160。
[0039]麥克風(fēng)控制器150通過通信器110,向座椅控制器130請求與置于車輛中的座椅的位置有關(guān)的信息(S15)。麥克風(fēng)控制器150利用從座椅控制器130接收到的信息,檢查座椅位置(S17)。參見圖3,置于車輛中的座椅S從點(diǎn)A移動到點(diǎn)B。座椅控制器130將從點(diǎn)A到點(diǎn)B的移動