一種定位目標聲源的方法和裝置的制造方法

文檔序號：9707171閱讀：453來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>測量裝置的制造及其應(yīng)用技術(shù)

一種定位目標聲源的方法和裝置的制造方法
【專利說明】一種定位目標聲源的方法和裝置【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及聲音處理技術(shù)，尤其涉及一種定位目標聲源的方法和裝置。【【背景技術(shù)】】
[0002] 現(xiàn)有聲源定位的方式一般采用麥克風(fēng)陣列來實現(xiàn)。
[0003] 對于雙麥克風(fēng)聲源定位，其是模擬人類通過聲音到達雙耳之間的時延或相位差來判斷聲源的位置，從而基于擬人化的雙麥克風(fēng)實現(xiàn)聲源定位。由于雙麥克風(fēng)不像人耳結(jié)構(gòu) 那樣精妙，雙麥克聲源定位具有很大的局限性，例如由兩個麥克風(fēng)組成的平面僅能判斷環(huán) 繞該麥克風(fēng)平面的空間中180度的聲音范圍，不能判斷聲音來自前方還是后方，同時對多個聲源的分辨效果也難以盡如人意。【
【發(fā)明內(nèi)容】
】
[0004] 有鑒于此，本發(fā)明提供了一種定位目標聲源的方法和裝置，以便于優(yōu)化聲源的分辨效果。
[0005] 具體技術(shù)方案如下：
[0006] 本發(fā)明提供了一種定位目標聲源的方法，所述方法包括：
[0007] 確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時延差；
[0008] 利用所述時延差，確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量；
[0009] 依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置。
[0010] 根據(jù)本發(fā)明一優(yōu)選實施例，在確定兩兩組合的陣元在預(yù)設(shè)方位的波束時延差時，將所述組合中一個陣元相對于另一個陣元在預(yù)設(shè)方位處接收同一波束的時間差作為所述波束時延差。
[0011] 根據(jù)本發(fā)明一優(yōu)選實施例，所述利用所述時延差，確定兩兩組合的陣元從所述預(yù) 設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量具體包括：
[0012] 依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元的互相關(guān)函數(shù)；
[0013] 利用時延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值；
[0014] 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量。
[0015] 根據(jù)本發(fā)明一優(yōu)選實施例，所述方法還包括:將互相關(guān)函數(shù)中的時域變量轉(zhuǎn)換為頻域變量，利用快速傅里葉變換確定所述互相關(guān)函數(shù)。
[0016] 根據(jù)本發(fā)明一優(yōu)選實施例，所述方法還包括:在所述利用快速傅里葉變換確定所述互相關(guān)函數(shù)之后，對所述兩兩組合的陣元中每個陣元獲取的波束進行頻域的增強，以對所述互相關(guān)函數(shù)進行銳化。
[0017] 根據(jù)本發(fā)明一優(yōu)選實施例，其中，所述增強是依據(jù)各陣元所接收波束的信噪比確定的。
[0018] 根據(jù)本發(fā)明一優(yōu)選實施例，所述依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置具體包括：
[0019] 確定所有預(yù)設(shè)方位的波束能量中的最大波束能量；
[0020] 對最大波束能量與預(yù)設(shè)的最小能量閾值進行比較，如果最大波束能量大于或等于最小能量閾值，則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標確定目標聲源的位置。
[0021] 根據(jù)本發(fā)明一優(yōu)選實施例，所述方法還包括：
[0022] 在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上，重新執(zhí)行所述依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量的步驟，以便確定另一聲源的位置。
[0023] 根據(jù)本發(fā)明一優(yōu)選實施例，所述方法還包括：
[0024] 如果定位出的目標聲源數(shù)量達到預(yù)設(shè)的目標聲源數(shù)量，則結(jié)束目標聲源定位;或者，
[0025] 如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值，則結(jié)束目標聲源的定位。
[0026] 根據(jù)本發(fā)明一優(yōu)選實施例，所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍的空間劃分為網(wǎng)格所形成的各網(wǎng)格點中選取的。
[0027] 本發(fā)明還提供了一種定位目標聲源的裝置，所述裝置包括：
[0028] 波束時延差確定單元，用于確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時延差；
[0029] 波束能量確定單元，用于利用所述時延差，確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量；
[0030] 聲源位置確定單元，用于依據(jù)所有預(yù)設(shè)方位的波束能量，確定聲源的位置。
[0031] 根據(jù)本發(fā)明一優(yōu)選實施例，所述波束時延差確定單元在確定兩兩組合的陣元在預(yù) 設(shè)方位的波束時延差時，將所述組合中一個陣元相對于另一個陣元在預(yù)設(shè)方位處接收同一波束的時間差作為所述波束時延差。
[0032]根據(jù)本發(fā)明一優(yōu)選實施例，所述波束能量確定單元具體執(zhí)行以下操作：
[0033] 依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元的互相關(guān)函數(shù)；
[0034] 利用時延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值；
[0035] 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量。
[0036] 根據(jù)本發(fā)明一優(yōu)選實施例，所述波束能量確定單元還執(zhí)行以下操作:將互相關(guān)函數(shù)中的時域變量轉(zhuǎn)換為頻域變量，利用快速傅里葉變換確定所述互相關(guān)函數(shù)。
[0037] 根據(jù)本發(fā)明一優(yōu)選實施例，所述波束能量確定單元在利用快速傅里葉變換確定所述互相關(guān)函數(shù)之后，還執(zhí)行以下操作:對所述兩兩組合的陣元中每個陣元獲取的波束進行頻域的增強，以對所述互相關(guān)函數(shù)進行銳化。
[0038] 根據(jù)本發(fā)明一優(yōu)選實施例，其中，所述增強是依據(jù)各陣元所接收波束的信噪比確定的。
[0039] 根據(jù)本發(fā)明一優(yōu)選實施例，所述聲源位置確定單元具體執(zhí)行以下操作：
[0040] 確定所有預(yù)設(shè)方位的波束能量中的最大波束能量；
[0041] 對最大波束能量與預(yù)設(shè)的最小能量閾值進行比較，如果最大波束能量大于或等于最小能量閾值，則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標確定目標聲源的位置。
[0042] 根據(jù)本發(fā)明一優(yōu)選實施例，所述聲源位置確定單元還用于執(zhí)行以下操作：
[0043]在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上，重新執(zhí)行依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能量的操作，以便確定另一聲源的位置。
[0044]根據(jù)本發(fā)明一優(yōu)選實施例，所述聲源位置確定單元還用于執(zhí)行如下操作：
[0045]如果定位出的目標聲源數(shù)量達到預(yù)設(shè)的目標聲源數(shù)量，則結(jié)束目標聲源定位;或者，
[0046]如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值，則結(jié)束目標聲源的定位。
[0047] 根據(jù)本發(fā)明一優(yōu)選實施例，所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍的空間劃分為網(wǎng)格所形成的各網(wǎng)格點中選取的。
[0048] 由以上技術(shù)方案可以看出，本發(fā)明采用麥克風(fēng)陣列，基于麥克風(fēng)陣列在所有預(yù)設(shè) 方位的波束能量，確定聲源的位置，提高了聲源的分辨效果。【【附圖說明】】
[0049] 圖1示出了一種麥克風(fēng)陣列的結(jié)構(gòu)示意圖；
[0050] 圖2示出了本發(fā)明實施例一提供的一種定位目標聲源的方法流程圖；
[0051] 圖3示出了本發(fā)明實施例一提供的一種在麥克風(fēng)陣列周圍的空間劃分預(yù)設(shè)方位的示意圖；
[0052] 圖4示出了本發(fā)明實施例二提供的一種定位目標聲源的裝置的結(jié)構(gòu)示意圖；
[0053]圖5示出了采用本發(fā)明進行聲源定位的效果圖。【【具體實施方式】】
[0054]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚，下面結(jié)合附圖和具體實施例對本發(fā)明進行詳細描述。
[0055] 本發(fā)明基于多麥克風(fēng)聲源定位來解決聲源定位問題。
[0056] 以下實施例以立方體排列的8麥克風(fēng)陣列結(jié)構(gòu)為例（如圖1所示），介紹定位目標聲源的方法和裝置。
[0057] 實際使用時，麥克風(fēng)的排列并沒有特定要求，但是為了能夠?qū)崿F(xiàn)360度全向定位，優(yōu)選地可以采用具有4個及以上麥克風(fēng)陣元，從而組成立體排列的麥克風(fēng)陣列結(jié)構(gòu)，并且預(yù) 先測量每個麥克風(fēng)陣元的三維坐標。
[0058]語音信號的頻率范圍一般為100-3400HZ，按照空間采樣定理，本發(fā)明的麥克風(fēng)間距可以設(shè)置為5-15cm。
[0059] 實施例一、
[0060] 圖2為本發(fā)明實施例一提供的一種定位目標聲源的方法流程圖。如圖2所示，該方法可以包括以下步驟：
[0061] 201、將預(yù)設(shè)范圍的空間劃分為多個預(yù)設(shè)方位。
[0062] 具體地，由于利用波束能量確定目標聲源的方位時，是需要遍歷麥克風(fēng)陣列周圍的360度的范圍內(nèi)的所有方位，進而根據(jù)所有方位的波束能量來確定聲源位置的。但是要計算得到所有方位的波束能量需要耗費極大的運算量，實際使用時沒有這個必要。
[0063] 例如對于機器人等特定的需要定位聲源的設(shè)備，5度左右的定位精度已經(jīng)可以滿足日常生活需求，因此為了提高計算效率，可以根據(jù)使用需要將麥克風(fēng)陣列周圍的由空間球體所體現(xiàn)的預(yù)設(shè)范圍分割成特定的網(wǎng)格，以使每一個網(wǎng)格對應(yīng)一個預(yù)設(shè)方位。
[0064

完整全部詳細技術(shù)資料下載

當(dāng)前第1頁1 2 3 4

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：李崢;李江勇;戴騰;
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進行咨詢。
1、邢老師：1.機械設(shè)計及理論 2.生物醫(yī)學(xué)材料及器械 3.聲發(fā)射檢測技術(shù)。
2、王老師：1.數(shù)字信號處理 2.傳感器技術(shù)及應(yīng)用 3.機電一體化產(chǎn)品開發(fā) 4.機械工程測試技術(shù) 5.逆向工程技術(shù)研究
3、王老師：1.機器人 2.嵌入式控制系統(tǒng)開發(fā)
4、張老師：1.機械設(shè)計的應(yīng)力分析、強度校核的計算機仿真 2.生物反應(yīng)器研制 3.生物力學(xué)
5、趙老師：檢測與控制技術(shù)、機器人技術(shù)、機電一體化技術(shù)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

麥克風(fēng)陣列聲源定位相關(guān)技術(shù)

聲源定位相關(guān)技術(shù)

聲源定位的產(chǎn)生機制是相關(guān)技術(shù)

聲源定位系統(tǒng)相關(guān)技術(shù)

聲源定位算法相關(guān)技術(shù)

聲源定位模塊相關(guān)技術(shù)

聲源定位技術(shù)相關(guān)技術(shù)

聲源定位應(yīng)用相關(guān)技術(shù)

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

一種定位目標聲源的方法和裝置的制造方法