一種定位目標(biāo)聲源的方法和裝置的制造方法_4

文檔序號：9707171閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>測量裝置的制造及其應(yīng)用技術(shù)>一種定位目標(biāo)聲源的方法和裝置的制造方法

合的陣元的互相關(guān)函數(shù)值之和確定預(yù)設(shè)方位的波束能量的操作，以便確定另一聲源的位置。
[0173] 其中，當(dāng)確定出當(dāng)前聲源的位置后，將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的目的在于，由于確定出的聲源位置的聲源對從其他預(yù)設(shè)位置確定的聲源能量會產(chǎn)生干擾，因此在確定所有預(yù)設(shè)方位的每一預(yù)設(shè)方位的波束能量之前，可以將其中的已經(jīng)確定了目標(biāo)聲源所在的預(yù)設(shè)方位處的互相關(guān)函數(shù)置為零，也就是不參考該已經(jīng)確定了目標(biāo)聲源所在的預(yù)設(shè)方位的波束能量。
[0174] 并且，本實(shí)施例還可以設(shè)置要定位的目標(biāo)聲源的數(shù)量，聲源位置確定單元404還可以用于執(zhí)行如下操作：
[0175]如果定位出的目標(biāo)聲源數(shù)量達(dá)到預(yù)設(shè)的目標(biāo)聲源數(shù)量，則結(jié)束目標(biāo)聲源定位;或者，
[0176] 如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值，則結(jié)束目標(biāo)聲源的定位。
[0177] 再舉一個(gè)例子，還是以圖1所示的立方體排列的8麥克風(fēng)陣列為例，語音信號采樣率為16KHz，每一幀信號長度取20ms，即320采樣點(diǎn)。
[0178] 在麥克風(fēng)陣列周圍lm處設(shè)置三個(gè)聲源，采用本發(fā)明進(jìn)行聲源定位的結(jié)果如圖5所示，圖5中，中心處的8個(gè)原點(diǎn)即為麥克風(fēng)陣列，透明球體用來示意周圍的空間。通過本發(fā)明實(shí)施例提供的方法和裝置，就能夠較為準(zhǔn)確地定位出麥克風(fēng)陣列周圍的三個(gè)聲源位置，如圖5中所示的三簇點(diǎn)集。
[0179] 由以上描述可以看出，本發(fā)明提供的上述方法和裝置可以具備以下優(yōu)點(diǎn)：
[0180] 1)本發(fā)明采用麥克風(fēng)陣列，基于麥克風(fēng)陣列在所有預(yù)設(shè)方位的波束能量，確定聲源的位置，提高了聲源的分辨效果。
[0181] 2)本發(fā)明充分利用芯片計(jì)算資源，采用頻域互相關(guān)函數(shù)方法求取波束能量，估計(jì) 目標(biāo)方位，大大減小計(jì)算量。
[0182] 3)采用基于信噪比的頻域加權(quán)的方式，提升了互相關(guān)函數(shù)峰的尖銳度，改善多目標(biāo)聲源定位的分辨能力。
[0183] 在本發(fā)明所提供的幾個(gè)實(shí)施例中，應(yīng)該理解到，所揭露的方法和裝置，可以通過其它的方式實(shí)現(xiàn)。例如，以上所描述的裝置實(shí)施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式。
[0184]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位于一個(gè)地方，或者也可以分布到多個(gè) 網(wǎng)絡(luò)單元上?？梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
[0185] 另外，在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中，也可以是各個(gè)單元單獨(dú)物理存在，也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn)，也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0186] 以上所述僅為本發(fā)明的較佳實(shí)施例而已，并不用以限制本發(fā)明，凡在本發(fā)明的精神和原則之內(nèi)，所做的任何修改、等同替換、改進(jìn)等，均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種定位目標(biāo)聲源的方法，其特征在于，所述方法包括：確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差；利用所述時(shí)延差，確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量；依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置。2. 根據(jù)權(quán)利要求1所述的方法，其特征在于，在確定兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差時(shí)，將所述組合中一個(gè)陣元相對于另一個(gè)陣元在預(yù)設(shè)方位處接收同一波束的時(shí)間差作為所述波束時(shí)延差。3. 根據(jù)權(quán)利要求1所述的方法，其特征在于，所述利用所述時(shí)延差，確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量具體包括：依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元的互相關(guān)函數(shù)；利用時(shí)延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值；依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量。4. 根據(jù)權(quán)利要求3所述的方法，其特征在于，所述方法還包括:將互相關(guān)函數(shù)中的時(shí)域變量轉(zhuǎn)換為頻域變量，利用快速傅里葉變換確定所述互相關(guān)函數(shù)。5. 根據(jù)權(quán)利要求4所述的方法，其特征在于，所述方法還包括:在所述利用快速傅里葉變換確定所述互相關(guān)函數(shù)之后，對所述兩兩組合的陣元中每個(gè)陣元獲取的波束進(jìn)行頻域的增強(qiáng)，以對所述互相關(guān)函數(shù)進(jìn)行銳化。6. 根據(jù)權(quán)利要求5所述的方法，其特征在于，其中，所述增強(qiáng)是依據(jù)各陣元所接收波束的信噪比確定的。7. 根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法，其特征在于，所述依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置具體包括：確定所有預(yù)設(shè)方位的波束能量中的最大波束能量；對最大波束能量與預(yù)設(shè)的最小能量閾值進(jìn)行比較，如果最大波束能量大于或等于最小能量閾值，則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標(biāo)確定目標(biāo)聲源的位置。8. 根據(jù)權(quán)利要求3所述的方法，其特征在于，所述方法還包括：在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上，重新執(zhí)行所述依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量的步驟，以便確定另一聲源的位置。9. 根據(jù)權(quán)利要求8所述的方法，其特征在于，所述方法還包括：如果定位出的目標(biāo)聲源數(shù)量達(dá)到預(yù)設(shè)的目標(biāo)聲源數(shù)量，則結(jié)束目標(biāo)聲源定位;或者，如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值，則結(jié)束目標(biāo)聲源的定位。10. 根據(jù)權(quán)利要求1-3任一項(xiàng)所述的方法，其特征在于，所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍的空間劃分為網(wǎng)格所形成的各網(wǎng)格點(diǎn)中選取的。11. 一種定位目標(biāo)聲源的裝置，其特征在于，所述裝置包括：波束時(shí)延差確定單元，用于確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差；波束能量確定單元，用于利用所述時(shí)延差，確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量；聲源位置確定單元，用于依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置。12. 根據(jù)權(quán)利要求11所述的裝置，其特征在于，所述波束時(shí)延差確定單元在確定兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差時(shí)，將所述組合中一個(gè)陣元相對于另一個(gè)陣元在預(yù)設(shè)方位處接收同一波束的時(shí)間差作為所述波束時(shí)延差。13. 根據(jù)權(quán)利要求11所述的裝置，其特征在于，所述波束能量確定單元具體執(zhí)行以下操作：依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元的互相關(guān)函數(shù)；利用時(shí)延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值；依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量。14. 根據(jù)權(quán)利要求13所述的裝置，其特征在于，所述波束能量確定單元還執(zhí)行以下操作:將互相關(guān)函數(shù)中的時(shí)域變量轉(zhuǎn)換為頻域變量，利用快速傅里葉變換確定所述互相關(guān)函數(shù)。15. 根據(jù)權(quán)利要求14所述的裝置，其特征在于，所述波束能量確定單元在利用快速傅里葉變換確定所述互相關(guān)函數(shù)之后，還執(zhí)行以下操作:對所述兩兩組合的陣元中每個(gè)陣元獲取的波束進(jìn)行頻域的增強(qiáng)，以對所述互相關(guān)函數(shù)進(jìn)行銳化。16. 根據(jù)權(quán)利要求15所述的裝置，其特征在于，其中，所述增強(qiáng)是依據(jù)各陣元所接收波束的信噪比確定的。17. 根據(jù)權(quán)利要求11-13任一項(xiàng)所述的裝置，其特征在于，所述聲源位置確定單元具體執(zhí)行以下操作：確定所有預(yù)設(shè)方位的波束能量中的最大波束能量；對最大波束能量與預(yù)設(shè)的最小能量閾值進(jìn)行比較，如果最大波束能量大于或等于最小能量閾值，則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標(biāo)確定目標(biāo)聲源的位置。18. 根據(jù)權(quán)利要求13所述的裝置，其特征在于，所述聲源位置確定單元還用于執(zhí)行以下操作：在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上，重新執(zhí)行依據(jù) 麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量的操作，以便確定另一聲源的位置。19. 根據(jù)權(quán)利要求18所述的裝置，其特征在于，所述聲源位置確定單元還用于執(zhí)行如下操作：如果定位出的目標(biāo)聲源數(shù)量達(dá)到預(yù)設(shè)的目標(biāo)聲源數(shù)量，則結(jié)束目標(biāo)聲源定位;或者，如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值，則結(jié)束目標(biāo)聲源的定位。20. 根據(jù)權(quán)利要求11-13任一項(xiàng)所述的裝置，其特征在于，所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍的空間劃分為網(wǎng)格所形成的各網(wǎng)格點(diǎn)中選取的。
【專利摘要】本發(fā)明公開了一種定位目標(biāo)聲源的方法和裝置。其中一種定位目標(biāo)聲源的方法包括：確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時(shí)延差；利用所述時(shí)延差，確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量；依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置。本發(fā)明采用麥克風(fēng)陣列，基于麥克風(fēng)陣列在所有預(yù)設(shè)方位的波束能量，確定聲源的位置，提高了聲源的分辨效果。
【IPC分類】G01S5/22
【公開號】CN105467364
【申請?zhí)枴緾N201510809839
【發(fā)明人】李崢, 李江勇, 戴騰
【申請人】百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
【公開日】2016年4月6日
【申請日】2015年11月20日

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第4頁1 2 3 4

相關(guān)技術(shù)