基于麥克風陣列的動態(tài)數(shù)量聲源跟蹤方法

文檔序號：9826337閱讀：798來源：國知局

基于麥克風陣列的動態(tài)數(shù)量聲源跟蹤方法
【技術領域】
[0001] 本發(fā)明涉及的是一種陣列音頻信號處理領域的方法，尤其涉及一種基于數(shù)據(jù)關聯(lián) 和粒子濾波的多聲源跟蹤方法。
【背景技術】
[0002] 在聲源定位與跟蹤的許多應用中，如人機交互、遠程會議、虛擬現(xiàn)實等，都需要對應用場景中的說話人進行定位與跟蹤。由于實際應用場景中存在噪聲，回響以及其他聲源的干擾，如何在復雜環(huán)境下完成對說話人實時的定位與跟蹤并保證系統(tǒng)的魯棒性一直是研究的熱點。除此之外，由于語音信號本身的非平穩(wěn)特性，聲源沉默與活躍狀態(tài)的隨機性，更使得這一問題更具有挑戰(zhàn)性。
[0003] 目前，對于單聲源的定位與跟蹤技術已經(jīng)非常成熟，主要采用基于TD0A的聲源定位算法與基于粒子濾波的聲源跟蹤算法。對于多聲源定位的問題，目前存在的主流方法主要分為兩類:基于可控波束形成的方法和基于現(xiàn)代高分辨率譜估計的方法，其中，后者需要對聲源數(shù)量具有先驗假設，而前者沒有這種限制。對于多聲源跟蹤的問題，由于存在觀測與跟蹤目標的匹配模糊問題，所以在對多個跟蹤目標位置更新之前，需要對觀測進行分類。目前存在的多聲源跟蹤算法主要采用最近鄰的原則對觀測與跟蹤聲源進行匹配。然而，這種處理方式忽略了實際情況下存在的很多其他可能性。并且，現(xiàn)有的多聲源跟蹤方法應用的場景是一種較為理想的環(huán)境，即，假設聲源數(shù)量可知且在跟蹤過程中不會變化，這意味著說話人在跟蹤過程中會不間斷地說話，這種限制使得現(xiàn)有的多聲源跟蹤算法難以應用于實際的場景。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明針對現(xiàn)有技術存在的上述不足，提供一種基于數(shù)據(jù)關聯(lián)和粒子濾波的多聲源跟蹤方法，既可提升聲源定位與跟蹤的準確度，又可以實現(xiàn)動態(tài)聲源數(shù)量的目標跟蹤，可應用在動態(tài)變化的復雜場景中。
[0005] 為了實現(xiàn)上述目的，本發(fā)明提供了一種基于麥克風陣列的動態(tài)數(shù)量聲源跟蹤方法，包括以下步驟：
[0006] S1、接收音頻信號，計算空間譜，檢測空間譜譜峰位置，得到觀測值；
[0007] S2、根據(jù)觀測值與當前時刻的K個跟蹤聲源進行數(shù)據(jù)關聯(lián)，計算空間譜峰與跟蹤聲源的匹配概率；
[0008] S3、檢查當前時刻粒子濾波器或檢查當前時刻跟蹤目標數(shù)量；
[0009] 若粒子濾波器已經(jīng)初始化或跟蹤目標數(shù)量不等于0,進入步驟S4;
[0010] 若粒子濾波器尚未初始化或跟蹤目標數(shù)量等于0,進入步驟S8;
[0011] S4、評估試用聲源存在概率并刪除偽聲源，監(jiān)測跟蹤聲源活躍狀態(tài)并刪除非活躍聲源；
[0012] S5、根據(jù)譜峰-聲源匹配邊緣后驗概率定義聲源的似然函數(shù)，并更新各聲源的粒子權重；
[0013] S6、根據(jù)粒子權重和粒子位置計算當前時刻各聲源的位置；
[0014] S7、根據(jù)貝葉斯推斷預測各聲源的先驗活躍概率；
[0015] S8、檢測各譜峰的匹配概率，若各譜峰的匹配概率大于預設的判定閾值，激活新聲源；
[0016] S9、預測下一個時刻各聲源粒子狀態(tài)；
[0017] S10、判斷各聲源的有效粒子數(shù)量，若有效粒子數(shù)量少于預設的粒子數(shù)量值，則重新采樣聲源的粒子，并進入步驟S1;反之，進入步驟S1。
[0018] 作為優(yōu)選的，步驟S2包括以下步驟：
[0019] S2.1、列舉所有譜峰-聲源匹配的組合；
[0020] S2.2、根據(jù)譜峰-聲源匹配的組合計算譜峰-聲源匹配聯(lián)合先驗概率；
[0021 ] S2.3、若存在跟蹤聲源，計算預測性似然概率;反之，直接進入步驟S2.4;
[0022] S2.4、根據(jù)所述譜峰-聲源匹配聯(lián)合先驗概率以及預測性似然概率計算譜峰-聲源匹配聯(lián)合后驗概率；
[0023] S2.5、重復步驟S2至S4,計算譜峰-聲源匹配邊緣后驗概率；
[0024] S2.6、歸一化譜峰-聲源匹配邊緣后驗概率。
[0025]作為優(yōu)選的，步驟S4包括以下步驟：
[0026] S4.1、計算各聲源當前觀測下的活躍概率；
[0027] S4.2、檢查各個聲源當前所處階段：
[0028] 若聲源處于試用階段，進入步驟S4.3;
[0029]若聲源處于跟蹤階段，進入步驟S4.4;
[0030] S4.3、評估試用聲源存在概率，刪除偽聲源；
[0031] S4.4、監(jiān)測跟蹤聲源活躍狀態(tài)，并刪除非活躍聲源。
[0032] 進一步的，步驟S4.3包括以下步驟：
[0033] S4.31、更新試用聲源累積活躍概率；
[0034] S4.32、檢查試用期計時器，若試用期未滿，進入步驟S5;
[0035]若試用期已滿，進入步驟S4.33;
[0036] S4.33、計算試用聲源在試用期間平均存在概率，若試用聲源在試用期間平均存在概率高于預設的存在性閾值，標記新聲源，并進入跟蹤階段;反之，刪除該試用聲源的粒子濾波器。
[0037] 進一步的，步驟S4.4包括以下步驟：
[0038] S4.41、檢驗跟蹤聲源當前時刻非活躍程度，
[0039]若非活躍程度小于預設的活躍值，非活躍計數(shù)器自加1，并進入步驟S4.42;
[0040] 反之，非活躍計數(shù)器清零，并進入步驟S5;
[0041] S4.42、檢查非活躍計數(shù)器，若非活躍計數(shù)器的值等于預設的次數(shù)，刪除該非活躍聲源。
[0042]作為優(yōu)選的，步驟S8包括以下步驟：
[0043] S8.1、檢測各譜峰的匹配概率，若各譜峰的匹配概率大于預設的判定閾值，進入步驟S8.2,反之，進入步驟S9;
[0044] S8.2、初始化新聲源粒子狀態(tài)，對粒子賦予均勻權值；
[0045] S8.3、初始化新聲源活躍概率；
[0046] S8.4、為新聲源分配ID;
[0047] S8.5、標記新聲源進入試用階段，開啟試用期計時器。
[0048] 與現(xiàn)有技術相比，本發(fā)明將數(shù)據(jù)關聯(lián)納入粒子濾波的框架之中，通過對觀測-聲源目標匹配先驗與后驗的精確建模解決了觀測與聲源之間的匹配模糊問題，由于數(shù)據(jù)關聯(lián)考慮了幾乎所有的匹配可能，本發(fā)明提出的方法能夠應對各種各樣不同的運動模式。另外，通過將新聲源的加入機制與非活躍聲源的刪除機制納入數(shù)據(jù)關聯(lián)與粒子濾波的框架，實現(xiàn)了動態(tài)聲源數(shù)量的多目標跟蹤，并且，不需要加入單獨的聲源活躍狀態(tài)檢測模塊，有效地降低了算法的運算時間，保證了跟蹤的實時性。
【附圖說明】
[0049] 圖1是本發(fā)明一實施例的工作主流程圖。
[0050] 圖2是本發(fā)明一實施例中步驟S2的流程示意圖。
[0051]圖3是本發(fā)明一實施例中步驟S4的流程示意圖。
[0052]圖4是本發(fā)明一實施例中聲源經(jīng)歷的階段圖。
[0053]圖5是本發(fā)明一實施例中實驗環(huán)境俯視圖。
【具體實施方式】
[0054] 為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚，下面將結合附圖對本發(fā)明的各實施方式進行詳細的闡述。
[0055] 為解決上述技術問題，本發(fā)明的第一實施方式提供了一種基于麥克風陣列的動態(tài) 數(shù)量聲源跟蹤方法，如圖5所示，在聽音室的中心位置布置8陣元圓形麥克風陣列，每個陣元采用平衡式測試麥克風接收空間聲場信息，每個通道的麥克風通過卡農(nóng)頭連接到聽音室外部的幻象電源，并通過多通道數(shù)據(jù)采集卡連接到PC計算機。由于本實施例中采用的是單個麥克風陣列，故而波束形成的搜索空間為以陣列中心為圓心的三維空間方位，即將一個單位球面分為足夠密的格點，實際應用過程中，格點數(shù)量的選取只要滿足分辨率的需要即可。整個聲源定位與跟蹤過程中，采樣率設置32KHz，幀長取為1024點，具體的步驟如下：
[0056] S1、打開音頻輸入流，將麥克風陣列讀取的音頻數(shù)據(jù)分幀并存入緩沖區(qū)，從緩沖區(qū) 取出一幀數(shù)據(jù)并運用波束形成算法計算空間譜，對空間譜進行譜峰檢測得到一系列觀測

完整全部詳細技術資料下載

當前第1頁1 2 3

該技術已申請專利。僅供學習研究，如用于商業(yè)用途，請聯(lián)系技術所有人。
技術研發(fā)人員：江曉波;蔣三新;應忍冬;劉佩林;
技術所有人：上海交通大學;
我是此專利的發(fā)明人

上一篇：身體狀況建議方法及電子裝置的制造方法
上一篇：改進的數(shù)據(jù)比較方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網(wǎng)絡及物聯(lián)網(wǎng)
4、王老師：1.計算機網(wǎng)絡安全 2.計算機仿真技術
5、王老師：1.網(wǎng)絡安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關技術

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

基于麥克風陣列的動態(tài)數(shù)量聲源跟蹤方法