合的陣元的互相關(guān)函數(shù)值 之和確定預(yù)設(shè)方位的波束能量的操作,以便確定另一聲源的位置。
[0173] 其中,當(dāng)確定出當(dāng)前聲源的位置后,將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相 關(guān)函數(shù)值置零的目的在于,由于確定出的聲源位置的聲源對從其他預(yù)設(shè)位置確定的聲源能 量會產(chǎn)生干擾,因此在確定所有預(yù)設(shè)方位的每一預(yù)設(shè)方位的波束能量之前,可以將其中的 已經(jīng)確定了目標(biāo)聲源所在的預(yù)設(shè)方位處的互相關(guān)函數(shù)置為零,也就是不參考該已經(jīng)確定了 目標(biāo)聲源所在的預(yù)設(shè)方位的波束能量。
[0174] 并且,本實(shí)施例還可以設(shè)置要定位的目標(biāo)聲源的數(shù)量,聲源位置確定單元404還可 以用于執(zhí)行如下操作:
[0175]如果定位出的目標(biāo)聲源數(shù)量達(dá)到預(yù)設(shè)的目標(biāo)聲源數(shù)量,則結(jié)束目標(biāo)聲源定位;或 者,
[0176] 如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值,則結(jié)束目標(biāo)聲源的 定位。
[0177] 再舉一個(gè)例子,還是以圖1所示的立方體排列的8麥克風(fēng)陣列為例,語音信號采樣 率為16KHz,每一幀信號長度取20ms,即320采樣點(diǎn)。
[0178] 在麥克風(fēng)陣列周圍lm處設(shè)置三個(gè)聲源,采用本發(fā)明進(jìn)行聲源定位的結(jié)果如圖5所 示,圖5中,中心處的8個(gè)原點(diǎn)即為麥克風(fēng)陣列,透明球體用來示意周圍的空間。通過本發(fā)明 實(shí)施例提供的方法和裝置,就能夠較為準(zhǔn)確地定位出麥克風(fēng)陣列周圍的三個(gè)聲源位置,如 圖5中所示的三簇點(diǎn)集。
[0179] 由以上描述可以看出,本發(fā)明提供的上述方法和裝置可以具備以下優(yōu)點(diǎn):
[0180] 1)本發(fā)明采用麥克風(fēng)陣列,基于麥克風(fēng)陣列在所有預(yù)設(shè)方位的波束能量,確定聲 源的位置,提高了聲源的分辨效果。
[0181] 2)本發(fā)明充分利用芯片計(jì)算資源,采用頻域互相關(guān)函數(shù)方法求取波束能量,估計(jì) 目標(biāo)方位,大大減小計(jì)算量。
[0182] 3)采用基于信噪比的頻域加權(quán)的方式,提升了互相關(guān)函數(shù)峰的尖銳度,改善多目 標(biāo)聲源定位的分辨能力。
[0183] 在本發(fā)明所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的方法和裝置,可以通過其 它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅 僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式。
[0184]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯 示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè) 網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目 的。
[0185] 另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以 是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單 元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0186] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精 神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種定位目標(biāo)聲源的方法,其特征在于,所述方法包括: 確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差; 利用所述時(shí)延差,確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述 預(yù)設(shè)方位的波束能量; 依據(jù)所有預(yù)設(shè)方位的波束能量,確定聲源的位置。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在確定兩兩組合的陣元在預(yù)設(shè)方位的波束 時(shí)延差時(shí),將所述組合中一個(gè)陣元相對于另一個(gè)陣元在預(yù)設(shè)方位處接收同一波束的時(shí)間差 作為所述波束時(shí)延差。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述時(shí)延差,確定兩兩組合的陣 元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量具體包括: 依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元的互 相關(guān)函數(shù); 利用時(shí)延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值; 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波 束能量。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括:將互相關(guān)函數(shù)中的時(shí)域 變量轉(zhuǎn)換為頻域變量,利用快速傅里葉變換確定所述互相關(guān)函數(shù)。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述方法還包括:在所述利用快速傅里葉 變換確定所述互相關(guān)函數(shù)之后,對所述兩兩組合的陣元中每個(gè)陣元獲取的波束進(jìn)行頻域的 增強(qiáng),以對所述互相關(guān)函數(shù)進(jìn)行銳化。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,其中,所述增強(qiáng)是依據(jù)各陣元所接收波束 的信噪比確定的。7. 根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述依據(jù)所有預(yù)設(shè)方位的波束能 量,確定聲源的位置具體包括: 確定所有預(yù)設(shè)方位的波束能量中的最大波束能量; 對最大波束能量與預(yù)設(shè)的最小能量閾值進(jìn)行比較,如果最大波束能量大于或等于最小 能量閾值,則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標(biāo)確定目標(biāo)聲源的位置。8. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括: 在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上,重新執(zhí)行所述 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能 量的步驟,以便確定另一聲源的位置。9. 根據(jù)權(quán)利要求8所述的方法,其特征在于,所述方法還包括: 如果定位出的目標(biāo)聲源數(shù)量達(dá)到預(yù)設(shè)的目標(biāo)聲源數(shù)量,則結(jié)束目標(biāo)聲源定位;或者, 如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值,則結(jié)束目標(biāo)聲源的定 位。10. 根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法,其特征在于,所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍 的空間劃分為網(wǎng)格所形成的各網(wǎng)格點(diǎn)中選取的。11. 一種定位目標(biāo)聲源的裝置,其特征在于,所述裝置包括: 波束時(shí)延差確定單元,用于確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延 差; 波束能量確定單元,用于利用所述時(shí)延差,確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取 的波束能量之和作為所述預(yù)設(shè)方位的波束能量; 聲源位置確定單元,用于依據(jù)所有預(yù)設(shè)方位的波束能量,確定聲源的位置。12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述波束時(shí)延差確定單元在確定兩兩組 合的陣元在預(yù)設(shè)方位的波束時(shí)延差時(shí),將所述組合中一個(gè)陣元相對于另一個(gè)陣元在預(yù)設(shè)方 位處接收同一波束的時(shí)間差作為所述波束時(shí)延差。13. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述波束能量確定單元具體執(zhí)行以下操 作: 依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元的互 相關(guān)函數(shù); 利用時(shí)延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值; 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波 束能量。14. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述波束能量確定單元還執(zhí)行以下操 作:將互相關(guān)函數(shù)中的時(shí)域變量轉(zhuǎn)換為頻域變量,利用快速傅里葉變換確定所述互相關(guān)函 數(shù)。15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述波束能量確定單元在利用快速傅里 葉變換確定所述互相關(guān)函數(shù)之后,還執(zhí)行以下操作:對所述兩兩組合的陣元中每個(gè)陣元獲 取的波束進(jìn)行頻域的增強(qiáng),以對所述互相關(guān)函數(shù)進(jìn)行銳化。16. 根據(jù)權(quán)利要求15所述的裝置,其特征在于,其中,所述增強(qiáng)是依據(jù)各陣元所接收波 束的信噪比確定的。17. 根據(jù)權(quán)利要求11-13任一項(xiàng)所述的裝置,其特征在于,所述聲源位置確定單元具體 執(zhí)行以下操作: 確定所有預(yù)設(shè)方位的波束能量中的最大波束能量; 對最大波束能量與預(yù)設(shè)的最小能量閾值進(jìn)行比較,如果最大波束能量大于或等于最小 能量閾值,則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標(biāo)確定目標(biāo)聲源的位置。18. 根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述聲源位置確定單元還用于執(zhí)行以下 操作: 在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上,重新執(zhí)行依據(jù) 麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量的 操作,以便確定另一聲源的位置。19. 根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述聲源位置確定單元還用于執(zhí)行如下 操作: 如果定位出的目標(biāo)聲源數(shù)量達(dá)到預(yù)設(shè)的目標(biāo)聲源數(shù)量,則結(jié)束目標(biāo)聲源定位;或者, 如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值,則結(jié)束目標(biāo)聲源的定 位。20. 根據(jù)權(quán)利要求11-13任一項(xiàng)所述的裝置,其特征在于,所述預(yù)設(shè)方位是從將預(yù)設(shè)范 圍的空間劃分為網(wǎng)格所形成的各網(wǎng)格點(diǎn)中選取的。
【專利摘要】本發(fā)明公開了一種定位目標(biāo)聲源的方法和裝置。其中一種定位目標(biāo)聲源的方法包括:確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差;利用所述時(shí)延差,確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量;依據(jù)所有預(yù)設(shè)方位的波束能量,確定聲源的位置。本發(fā)明采用麥克風(fēng)陣列,基于麥克風(fēng)陣列在所有預(yù)設(shè)方位的波束能量,確定聲源的位置,提高了聲源的分辨效果。
【IPC分類】G01S5/22
【公開號】CN105467364
【申請?zhí)枴緾N201510809839
【發(fā)明人】李崢, 李江勇, 戴騰
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2016年4月6日
【申請日】2015年11月20日