一種定位目標聲源的方法和裝置的制造方法
【專利說明】一種定位目標聲源的方法和裝置 【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及聲音處理技術(shù),尤其涉及一種定位目標聲源的方法和裝置。 【【背景技術(shù)】】
[0002] 現(xiàn)有聲源定位的方式一般采用麥克風(fēng)陣列來實現(xiàn)。
[0003] 對于雙麥克風(fēng)聲源定位,其是模擬人類通過聲音到達雙耳之間的時延或相位差來 判斷聲源的位置,從而基于擬人化的雙麥克風(fēng)實現(xiàn)聲源定位。由于雙麥克風(fēng)不像人耳結(jié)構(gòu) 那樣精妙,雙麥克聲源定位具有很大的局限性,例如由兩個麥克風(fēng)組成的平面僅能判斷環(huán) 繞該麥克風(fēng)平面的空間中180度的聲音范圍,不能判斷聲音來自前方還是后方,同時對多個 聲源的分辨效果也難以盡如人意。 【
【發(fā)明內(nèi)容】
】
[0004] 有鑒于此,本發(fā)明提供了一種定位目標聲源的方法和裝置,以便于優(yōu)化聲源的分 辨效果。
[0005] 具體技術(shù)方案如下:
[0006] 本發(fā)明提供了一種定位目標聲源的方法,所述方法包括:
[0007] 確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束時延差;
[0008] 利用所述時延差,確定兩兩組合的陣元從所述預(yù)設(shè)方位獲取的波束能量之和作為 所述預(yù)設(shè)方位的波束能量;
[0009] 依據(jù)所有預(yù)設(shè)方位的波束能量,確定聲源的位置。
[0010] 根據(jù)本發(fā)明一優(yōu)選實施例,在確定兩兩組合的陣元在預(yù)設(shè)方位的波束時延差時, 將所述組合中一個陣元相對于另一個陣元在預(yù)設(shè)方位處接收同一波束的時間差作為所述 波束時延差。
[0011] 根據(jù)本發(fā)明一優(yōu)選實施例,所述利用所述時延差,確定兩兩組合的陣元從所述預(yù) 設(shè)方位獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量具體包括:
[0012] 依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元 的互相關(guān)函數(shù);
[0013] 利用時延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值;
[0014] 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位 的波束能量。
[0015] 根據(jù)本發(fā)明一優(yōu)選實施例,所述方法還包括:將互相關(guān)函數(shù)中的時域變量轉(zhuǎn)換為 頻域變量,利用快速傅里葉變換確定所述互相關(guān)函數(shù)。
[0016] 根據(jù)本發(fā)明一優(yōu)選實施例,所述方法還包括:在所述利用快速傅里葉變換確定所 述互相關(guān)函數(shù)之后,對所述兩兩組合的陣元中每個陣元獲取的波束進行頻域的增強,以對 所述互相關(guān)函數(shù)進行銳化。
[0017] 根據(jù)本發(fā)明一優(yōu)選實施例,其中,所述增強是依據(jù)各陣元所接收波束的信噪比確 定的。
[0018] 根據(jù)本發(fā)明一優(yōu)選實施例,所述依據(jù)所有預(yù)設(shè)方位的波束能量,確定聲源的位置 具體包括:
[0019] 確定所有預(yù)設(shè)方位的波束能量中的最大波束能量;
[0020] 對最大波束能量與預(yù)設(shè)的最小能量閾值進行比較,如果最大波束能量大于或等于 最小能量閾值,則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標確定目標聲源的位置。
[0021] 根據(jù)本發(fā)明一優(yōu)選實施例,所述方法還包括:
[0022] 在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上,重新執(zhí)行 所述依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波 束能量的步驟,以便確定另一聲源的位置。
[0023] 根據(jù)本發(fā)明一優(yōu)選實施例,所述方法還包括:
[0024] 如果定位出的目標聲源數(shù)量達到預(yù)設(shè)的目標聲源數(shù)量,則結(jié)束目標聲源定位;或 者,
[0025] 如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值,則結(jié)束目標聲源的 定位。
[0026] 根據(jù)本發(fā)明一優(yōu)選實施例,所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍的空間劃分為網(wǎng)格所形 成的各網(wǎng)格點中選取的。
[0027] 本發(fā)明還提供了一種定位目標聲源的裝置,所述裝置包括:
[0028] 波束時延差確定單元,用于確定麥克風(fēng)陣列中兩兩組合的陣元在預(yù)設(shè)方位的波束 時延差;
[0029] 波束能量確定單元,用于利用所述時延差,確定兩兩組合的陣元從所述預(yù)設(shè)方位 獲取的波束能量之和作為所述預(yù)設(shè)方位的波束能量;
[0030] 聲源位置確定單元,用于依據(jù)所有預(yù)設(shè)方位的波束能量,確定聲源的位置。
[0031] 根據(jù)本發(fā)明一優(yōu)選實施例,所述波束時延差確定單元在確定兩兩組合的陣元在預(yù) 設(shè)方位的波束時延差時,將所述組合中一個陣元相對于另一個陣元在預(yù)設(shè)方位處接收同一 波束的時間差作為所述波束時延差。
[0032]根據(jù)本發(fā)明一優(yōu)選實施例,所述波束能量確定單元具體執(zhí)行以下操作:
[0033] 依據(jù)所述兩兩組合的陣元從所述預(yù)設(shè)方位獲取的音頻信號確定兩兩組合的陣元 的互相關(guān)函數(shù);
[0034] 利用時延差確定所述兩兩組合的陣元的互相關(guān)函數(shù)的值;
[0035] 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位 的波束能量。
[0036] 根據(jù)本發(fā)明一優(yōu)選實施例,所述波束能量確定單元還執(zhí)行以下操作:將互相關(guān)函 數(shù)中的時域變量轉(zhuǎn)換為頻域變量,利用快速傅里葉變換確定所述互相關(guān)函數(shù)。
[0037] 根據(jù)本發(fā)明一優(yōu)選實施例,所述波束能量確定單元在利用快速傅里葉變換確定所 述互相關(guān)函數(shù)之后,還執(zhí)行以下操作:對所述兩兩組合的陣元中每個陣元獲取的波束進行 頻域的增強,以對所述互相關(guān)函數(shù)進行銳化。
[0038] 根據(jù)本發(fā)明一優(yōu)選實施例,其中,所述增強是依據(jù)各陣元所接收波束的信噪比確 定的。
[0039] 根據(jù)本發(fā)明一優(yōu)選實施例,所述聲源位置確定單元具體執(zhí)行以下操作:
[0040] 確定所有預(yù)設(shè)方位的波束能量中的最大波束能量;
[0041] 對最大波束能量與預(yù)設(shè)的最小能量閾值進行比較,如果最大波束能量大于或等于 最小能量閾值,則依據(jù)最大波束能量對應(yīng)的預(yù)設(shè)方位坐標確定目標聲源的位置。
[0042] 根據(jù)本發(fā)明一優(yōu)選實施例,所述聲源位置確定單元還用于執(zhí)行以下操作:
[0043]在將確定出位置的聲源對應(yīng)的預(yù)設(shè)方位的互相關(guān)函數(shù)值置零的基礎(chǔ)上,重新執(zhí)行 依據(jù)麥克風(fēng)陣列中所有兩兩組合的陣元的互相關(guān)函數(shù)值之和確定所述預(yù)設(shè)方位的波束能 量的操作,以便確定另一聲源的位置。
[0044]根據(jù)本發(fā)明一優(yōu)選實施例,所述聲源位置確定單元還用于執(zhí)行如下操作:
[0045]如果定位出的目標聲源數(shù)量達到預(yù)設(shè)的目標聲源數(shù)量,則結(jié)束目標聲源定位;或 者,
[0046]如果剩余所有預(yù)設(shè)方位的音頻信號能量均小于最小能量閾值,則結(jié)束目標聲源的 定位。
[0047] 根據(jù)本發(fā)明一優(yōu)選實施例,所述預(yù)設(shè)方位是從將預(yù)設(shè)范圍的空間劃分為網(wǎng)格所形 成的各網(wǎng)格點中選取的。
[0048] 由以上技術(shù)方案可以看出,本發(fā)明采用麥克風(fēng)陣列,基于麥克風(fēng)陣列在所有預(yù)設(shè) 方位的波束能量,確定聲源的位置,提高了聲源的分辨效果。 【【附圖說明】】
[0049] 圖1示出了一種麥克風(fēng)陣列的結(jié)構(gòu)示意圖;
[0050] 圖2示出了本發(fā)明實施例一提供的一種定位目標聲源的方法流程圖;
[0051] 圖3示出了本發(fā)明實施例一提供的一種在麥克風(fēng)陣列周圍的空間劃分預(yù)設(shè)方位的 示意圖;
[0052] 圖4示出了本發(fā)明實施例二提供的一種定位目標聲源的裝置的結(jié)構(gòu)示意圖;
[0053]圖5示出了采用本發(fā)明進行聲源定位的效果圖。 【【具體實施方式】】
[0054]為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖和具體實施例對 本發(fā)明進行詳細描述。
[0055] 本發(fā)明基于多麥克風(fēng)聲源定位來解決聲源定位問題。
[0056] 以下實施例以立方體排列的8麥克風(fēng)陣列結(jié)構(gòu)為例(如圖1所示),介紹定位目標聲 源的方法和裝置。
[0057] 實際使用時,麥克風(fēng)的排列并沒有特定要求,但是為了能夠?qū)崿F(xiàn)360度全向定位, 優(yōu)選地可以采用具有4個及以上麥克風(fēng)陣元,從而組成立體排列的麥克風(fēng)陣列結(jié)構(gòu),并且預(yù) 先測量每個麥克風(fēng)陣元的三維坐標。
[0058]語音信號的頻率范圍一般為100-3400HZ,按照空間采樣定理,本發(fā)明的麥克風(fēng)間 距可以設(shè)置為5-15cm。
[0059] 實施例一、
[0060] 圖2為本發(fā)明實施例一提供的一種定位目標聲源的方法流程圖。如圖2所示,該方 法可以包括以下步驟:
[0061] 201、將預(yù)設(shè)范圍的空間劃分為多個預(yù)設(shè)方位。
[0062] 具體地,由于利用波束能量確定目標聲源的方位時,是需要遍歷麥克風(fēng)陣列周圍 的360度的范圍內(nèi)的所有方位,進而根據(jù)所有方位的波束能量來確定聲源位置的。但是要計 算得到所有方位的波束能量需要耗費極大的運算量,實際使用時沒有這個必要。
[0063] 例如對于機器人等特定的需要定位聲源的設(shè)備,5度左右的定位精度已經(jīng)可以滿 足日常生活需求,因此為了提高計算效率,可以根據(jù)使用需要將麥克風(fēng)陣列周圍的由空間 球體所體現(xiàn)的預(yù)設(shè)范圍分割成特定的網(wǎng)格,以使每一個網(wǎng)格對應(yīng)一個預(yù)設(shè)方位。
[0064