一種實現(xiàn)機器人聽覺功能的聲源定位處理模塊的制作方法
【技術領域】
[0001] 本實用新型屬于信號處理領域,具體是一種實現(xiàn)機器人聽覺功能的聲源定位處理 模塊。
【背景技術】
[0002] 隨著社會生產(chǎn)力的發(fā)展和多媒體處理技術的進步,人們對機器人功能的要求越來 越高,期望機器人能"聽"、能"看"、能"動"。機器人在實際應用中,主人通過語音給機器人 發(fā)送指令,機器人通過聲源定位技術估算出主人的位置方向,然后控制自己轉動使正面面 向主人所有的位置,進一步,如果聽說主人"過來"的指令,機器人將走向主人所在的位置。 通過聲源定位技術實現(xiàn)機器人的聽覺功能。
[0003] 聲源定位的基本原理,就是將采集聲音信號的傳聲器在空間上布成一定拓撲結果 的接收陣列,傳聲器工作在被動接收的狀態(tài)下,接收來自目標聲場的聲音信息并采用一定 的算法對聲源信號進行處理,從而估計出目標聲源在空間上的位置和運動速度等信息。聲 波到達傳聲器陣列中各個陣元的時間和角度不同,則導致不同陣元之間接收到的聲音信號 在時間上存在差值,即通常所說的時間延時。聲源定位技術正是利用對這些時延信息進行 處理,最后估算出聲源的位置和方向信息,即實現(xiàn)聲源定位。
[0004] 聲源定位技術就是通過具有一定幾何關系的麥克風采集聲音信號,通過數(shù)字信號 處理得到聲源在某一參考坐標系統(tǒng)中的位置。經(jīng)過多年的發(fā)展,基于麥克風陣列的聲源定 位技術已經(jīng)有了一些比較成熟的理論和方法。技術大體上可以分為兩類:(1)基于最大輸 出功率的可控波束形成技術;(2)高分辨率譜估計技術。其中,基于最大輸出功率的可控波 束形成技術是對陣列中具有一定幾何關系陣元的輸出信號進行相應處理形成波束,波束最 大功率輸出點即聲源在參考域的位置。然而,這種處理方式存在計算復雜,運算量過大,定 位計算所需時間過長,不適合實時定位系統(tǒng)等缺陷;高分辨率譜估計技術需要對矩陣進行 特征值分解,因此運算量較大,計算時間也非常大,通常需要使用計算機來運算,也不適合 應用于實時定位系統(tǒng)。 【實用新型內容】
[0005] 針對上述【背景技術】中指出現(xiàn)有技術的缺陷,現(xiàn)提供一種能夠實現(xiàn)機器人聽覺功能 的聲源定位處理模塊,本實用新型的聲源定位處理模塊通過聲源定位技術,彌補了機器人 在其它系統(tǒng)如視覺,觸覺等上的不足,可以更好的獲取周圍環(huán)境的信息,提高環(huán)境適應性, 提高機器人的智能性能,適合大量應用于實時定位系統(tǒng)。本實用新型解決其技術問題所采 用的技術方案是這樣的:
[0006] -種實現(xiàn)機器人聽覺功能的聲源定位處理模塊,包括4個麥克風陣列、前置放大 電路模塊、A/D轉換模塊、FPGA模塊以及機器人主處理器,所述前置放大電路模塊通過4個 麥克風陣列與A/D轉換模塊連接,所述FPGA模塊位于A/D轉換模塊和機器人主處理器之 間。
[0007] 本實用新型解決其技術問題的技術方案進一步還包括:
[0008] 所述4個麥克風陣列采用四元十字陣列方式,且四個麥克風按照十字的方式擺布 在一個平面之內。
[0009] 所述FPGA模塊包括4個子模塊,分別是聲源信號采集模塊、時延計算模塊、定位計 算模塊和結果輸出模塊。
[0010] 所述聲源信號采集模塊按照20KHz的采樣率控制AD轉換,聲源信號采集模塊完成 各個模塊的初始化控制。
[0011] 所述結果輸出模塊通過串口輸出目標聲源的方向和距離給機器人主處理器,串口 采用9600的波特率傳輸方式。
[0012] 與現(xiàn)有技術相比,本實用新型取得的有益技術效果為:本實用新型的聲源定位處 理模塊通過聲源定位技術,彌補了機器人在其它系統(tǒng)如視覺,觸覺等上的不足,可以更好的 獲取周圍環(huán)境的信息,提高環(huán)境適應性,提高機器人的智能性能,適合大量應用于實時定位 系統(tǒng)。
【附圖說明】
[0013] 圖1為本實用新型聲源定位處理模塊的硬件框圖。
[0014] 圖2為本實用新型聲源定位處理模塊中FPGA模塊的流程圖。
[0015] 圖3為本實用新型聲源定位處理模塊的麥克風擺布示意圖。
【具體實施方式】
[0016] 下面將結合附圖來對本實用新型作進一步的說明。
[0017] 請參閱圖1,本實用新型聲源定位處理模塊包括4個麥克風陣列、前置放大電路模 塊、A/D轉換模塊、FPGA模塊以及機器人主處理器,其中前置放大電路模塊通過4個麥克風 陣列與A/D轉換模塊連接,F(xiàn)PGA模塊位于A/D轉換模塊和機器人主處理器之間。本實用 新型聲源定位處理模塊的工作原理如下:4個麥克風陣列用于接收聲音信號,把目標聲音 信號轉換成電信號,前置放大電路對電信號進行放大,放大后的信號進行A/D轉換后送入 FPGA(可編程邏輯器件)做信號處理,F(xiàn)PGA模炔基于廣義互相關法到達時延差算法進行各 個麥克風之間的時延參數(shù)計算,最后根據(jù)空間定位方法計算出目標聲源的方向和位置并輸 出給機器人主處理器。
[0018] 請參閱圖2、圖3,其中FPGA模塊包含4個子模塊,分別是聲源信號采集模塊、時延 計算模塊、定位計算模塊和結果輸出模塊。聲源信號采集模塊完成各個模塊的初始化控制 以及按照20KHz的采樣率控制AD轉換;時延計算模炔基于廣義互相關時延估計法計算兩個 麥克風之間的聲音時延,該方法需要計算兩個麥克風接收到的信號幅值(或相位)的互相 關函數(shù)的峰值偏移量,再根據(jù)對信號的采樣頻率,就可以估算出時間延遲。
[0019] 本實用新型的4個麥克風的擺布采用四元十字陣列方式,如圖3所示,將四個麥克 風按照十字的方式擺布在一個平面之內。其中S代表聲源的位置,Ml,M2,M3,M4分別為四 元十字陣列中四個陣元的位置。我們假設以Χ0Υ平面為地面,則聲源信號就假設在平面的 上方。這樣目標方位角為氣聲源仰角為Θ。r為目標聲源到坐標原點0的距離,使用tl] 表示兩個麥克風器%與Mj接收到聲音的時間差。根據(jù)下述的方程式分別計算出目標聲源 的方位角,,仰角Θ以及距離r [0020]
[0021] 然后再將結果輸出模塊通過串口輸出目標聲源的方向和距離給機器人主處理器, 串口采用9600的波特率傳輸方式。
[0022] 以上僅為本實用新型的較佳實施例,并不用以限制本實用新型,本實用新型的保 護范圍以所附權利要求為準,本領域技術人員在不付出創(chuàng)造性的勞動下所作出的等同或者 可以預料的實施方式,均應包含在本實用新型的保護范圍之內。
【主權項】
1. 一種實現(xiàn)機器人聽覺功能的聲源定位處理模塊,其特征在于,包括4個麥克風陣列、 前置放大電路模塊、A/D轉換模塊、FPGA模塊以及機器人主處理器,所述前置放大電路模塊 通過4個麥克風陣列與A/D轉換模塊連接,所述FPGA模塊位于A/D轉換模塊和機器人主處 理器之間,所述FPGA模塊包括4個子模塊,分別是聲源信號采集模塊、時延計算模塊、定位 計算模塊和結果輸出模塊。2. 如權利要求1所述的聲源定位處理模塊,其特征在于,所述4個麥克風陣列采用四元 十字陣列方式,且四個麥克風按照十字的方式擺布在一個平面之內。3. 如權利要求1所述的聲源定位處理模塊,其特征在于,所述聲源信號采集模塊按照 20kHz的采樣率控制AD轉換,聲源信號采集模塊完成各個模塊的初始化控制。4. 如權利要求1所述的聲源定位處理模塊,其特征在于,所述結果輸出模塊通過串口 輸出目標聲源的方向和距離給機器人主處理器,串口采用9600的波特率傳輸方式。
【專利摘要】本實用新型屬于信號處理領域,具體為一種實現(xiàn)機器人聽覺功能的聲源定位處理模塊,包括4個麥克風陣列、前置放大電路模塊、A/D轉換模塊、FPGA模塊以及機器人主處理器,所述前置放大電路模塊通過4個麥克風陣列與A/D轉換模塊連接,所述FPGA模塊位于A/D轉換模塊和機器人主處理器之間。本實用新型的聲源定位處理模塊通過聲源定位技術,彌補了機器人在其它系統(tǒng)如視覺,觸覺等上的不足,可以更好的獲取周圍環(huán)境的信息,提高環(huán)境適應性,提高機器人的智能性能,適合大量應用于實時定位系統(tǒng)。
【IPC分類】G01S5/22
【公開號】CN205067729
【申請?zhí)枴緾N201520618654
【發(fā)明人】文康益, 莊永軍, 梁磊, 徐東群
【申請人】旗瀚科技股份有限公司
【公開日】2016年3月2日
【申請日】2015年8月17日