用于映射源位置的系統(tǒng)和方法
【專利摘要】本發(fā)明描述一種用于通過電子裝置映射源位置的方法。所述方法包含獲得傳感器數(shù)據。所述方法還包含基于所述傳感器數(shù)據將源位置映射到電子裝置坐標。所述方法進一步包含將所述源位置從電子裝置坐標映射到物理坐標。所述方法另外包含基于映射而執(zhí)行操作。
【專利說明】用于映射源位置的系統(tǒng)和方法
[0001] 相關申請案
[0002] 本申請案涉及2012年10月12日申請的第61/713, 447號美國臨時專利申請 案"用于映射坐標的系統(tǒng)和方法(SYSTEMS AND METHODS FOR MAPPING COORDINATES)"、 2012年10月15日申請的第61/714,212號美國臨時專利申請案"用于映射坐標的系統(tǒng) 和方法(SYSTEMS AND METHODS FOR MAPPING C00RDINATES)"、2012年 4 月 13 日申請的 第61/624, 181號美國臨時專利申請案"用于估計到達方向的系統(tǒng)、方法及設備(SYSTEMS, METHODS, AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)"、2012年5月 4 日 申請的第61/642, 954號美國臨時專利申請案"用于估計到達方向的系統(tǒng)、方法及設備 (SYSTEMS,METH0DS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)",及2012年 11月14日申請的第61/726, 336號美國臨時專利申請案"用于估計到達方向的系統(tǒng)、方法 及設備(SYSTEMS,METHODS,AND APPARATUS FOR ESTIMATING DIRECTION OF ARRIVAL)" 且 主張所述申請案的權益。
【技術領域】
[0003] 本發(fā)明大體上涉及電子裝置。更具體來說,本發(fā)明涉及用于映射源位置的系統(tǒng)和 方法。
【背景技術】
[0004] 在過去幾十年中,電子裝置的使用已變得常見。具體來說,電子技術的進步已減少 越來越復雜且有用的電子裝置的成本。成本減少和消費者需求已使電子裝置的使用激增, 使得電子裝置在現(xiàn)代社會中幾乎無所不在。隨著電子裝置的使用已擴大,對電子裝置的新 的和改進型特征的需求也擴大。更特定來說,較快速、較有效地執(zhí)行功能或具有較高質量的 電子裝置常常廣受歡迎。
[0005] -些電子裝置(例如,蜂窩式電話、智能電話、計算機等等)使用音頻或話語信號。 這些電子裝置可譯碼話語信號以用于存儲或發(fā)射。舉例來說,蜂窩式電話使用麥克風俘獲 用戶的語音或話語。麥克風將聲信號轉換為電子信號。此電子信號可接著經格式化(例如, 經譯碼)以用于發(fā)射到另一裝置(例如,蜂窩式電話、智能電話、計算機等等)以用于回放 或用于存儲。
[0006] 有噪聲的音頻信號可引起特定挑戰(zhàn)。舉例來說,計算音頻信號可能降低所要的音 頻信號的質量。如從本論述可看出,提高電子裝置中的音頻信號質量的系統(tǒng)和方法可為有 益的。
【發(fā)明內容】
[0007] 描述一種用于通過電子裝置映射源位置的方法。所述方法包含獲得傳感器數(shù)據。 所述方法還包含基于所述傳感器數(shù)據將源位置映射到電子裝置坐標。所述方法進一步包含 將所述源位置從所述電子裝置坐標映射到物理坐標。所述方法另外包含基于映射而執(zhí)行操 作。所述傳感器數(shù)據可從一或多個麥克風、加速度計、陀螺儀、羅盤、紅外線傳感器、接近度 傳感器、相機和/或超聲傳感器獲得。所述源位置可對應于音頻源。
[0008] 執(zhí)行所述操作可包含將所述源位置從所述物理坐標映射到三維顯示空間中。所述 物理坐標可包含對應于地球坐標的二維平面。執(zhí)行所述操作可包含在三維顯示空間中維持 源定向而不管裝置定向如何。
[0009] 所述方法可包含基于所述傳感器數(shù)據而確定電子裝置定向。所述方法可包含基于 所述傳感器數(shù)據而檢測電子裝置定向中的任何變化。所述方法可包含檢測在電子裝置定向 與參考定向之間是否存在差異。
[0010] 執(zhí)行操作可包含切換到將所述物理坐標中的源的空間分辨率最大化的電子裝置 麥克風配置。執(zhí)行操作可包含基于所述映射而在三個維度中跟蹤源。執(zhí)行操作可包含獨立 于電子裝置定向而執(zhí)行非靜態(tài)噪聲抑制。
[0011] 所述方法可包含將所述源位置投影到二維空間中。所述方法可包含切換到在所述 二維空間中在兩個維度中進行跟蹤。
[0012] 所述電子裝置可包含三個麥克風且可能夠區(qū)別360度內的音頻信號。所述電子裝 置可包含兩個麥克風且可能夠區(qū)別180度內的音頻信號。
[0013] 還描述一種用于通過電子裝置映射源位置的電子裝置。所述電子裝置包含獲得傳 感器數(shù)據的至少一個傳感器。所述電子裝置還包括耦合到至少一個傳感器的映射器電路。 所述映射器電路基于所述傳感器數(shù)據將源位置映射到電子裝置坐標且將所述源位置從所 述電子裝置坐標映射到物理坐標。所述電子裝置進一步包含耦合到所述映射器電路的操作 電路。所述操作電路基于映射而執(zhí)行操作。
[0014] 還描述一種用于映射源位置的計算機程序產品。所述計算機程序產品包括具有指 令的非暫時性有形計算機可讀媒體。所述指令包含用于致使電子裝置獲得傳感器數(shù)據的代 碼。所述指令還包含用于致使所述電子裝置基于所述傳感器數(shù)據將源位置映射到電子裝置 坐標的代碼。所述指令進一步包含用于致使所述電子裝置將所述源位置從所述電子裝置坐 標映射到物理坐標的代碼。所述指令另外包含用于致使所述電子裝置基于映射而執(zhí)行操作 的代碼。
[0015] 還描述一種用于映射源位置的設備。所述設備包含用于獲得傳感器數(shù)據的裝置。 所述設備還包含用于基于所述傳感器數(shù)據將源位置映射到電子裝置坐標的裝置。所述設備 進一步包含用于將所述源位置從所述電子裝置坐標映射到物理坐標的裝置。所述設備另外 包含用于基于映射而執(zhí)行操作的裝置。
【專利附圖】
【附圖說明】
[0016] 圖1展示多麥克風手持機的多個視圖;
[0017] 圖2A展不相對于麥克風對的平面波傳播的遠場模型;
[0018] 圖2B展示線性陣列中的多個麥克風對;
[0019] 圖3A展示針對四個不同到達方向(D0A)的解開的相位延遲對頻率的曲線圖;
[0020] 圖3B展示針對圖3A中所描繪的相同的四個不同到達方向的纏繞的相位延遲對頻 率的曲線圖;
[0021] 圖4A展示兩個D0A候選者的所測量的相位延遲值及所計算的值的實例;
[0022] 圖4B展示沿著電視屏幕的頂部邊緣布置的麥克風的線性陣列;
[0023] 圖5A展示計算幀的D0A差的實例;
[0024] 圖5B展示計算D0A估計的實例;
[0025] 圖5C展示識別每一頻率的D0A估計的實例;
[0026] 圖6A展示使用所計算的似然度來識別針對給定頻率的最佳麥克風對及最佳D0A 候選者的實例;
[0027] 圖6B展示似然度計算的實例;
[0028] 圖7展示偏壓去除的實例;
[0029] 圖8展示偏壓去除的另一實例;
[0030] 圖9展示在幀及頻率上繪制所估計的D0A處的源活動性似然度的角度圖的實例;
[0031] 圖10A展不揚聲器電話應用的實例;
[0032] 圖10B展示在麥克風陣列的平面中逐對D0A估計到360°范圍的映射;
[0033] 圖11A到B展示D0A估計中的模糊性;
[0034] 圖11C展示所觀測的D0A的正負號與x-y平面的象限之間的關系;
[0035] 圖12A到12D展示其中源位于麥克風平面上方的實例;
[0036] 圖13A展示沿著非正交軸的麥克風對的實例;
[0037] 圖13B展示使用圖13A的陣列獲得相對于正交的X及y軸的D0A估計的實例;
[0038] 圖13C說明針對兩個不同D0A的實例的不同陣列的麥克風處的并行波前到達之間 的關系;
[0039] 圖14A到14B展示兩對麥克風陣列的逐對歸一化的波束成形器/零限波束成形器 (BFNF)的實例;
[0040] 圖15A展示兩對麥克風陣列;
[0041] 圖15B展示逐對歸一化的最小方差無失真響應(MVDR)BFNF的實例;
[0042] 圖16A展示其中矩陣AHA不處于病態(tài)的頻率的逐對BFNF的實例;
[0043] 圖16B展示導向向量的實例;
[0044] 圖17展示如本文所描述的源方向估計的一體化方法的一個實例流程圖;
[0045] 圖18到31展示如本文所描述的D0A估計、源鑒別及源跟蹤的實際結果的實例;
[0046] 圖32A展示電話設計,且圖32B到32D展示與對應的可視化顯示器一起在各種模 式中使用此類設計。
[0047] 圖33A展示根據一般配置的方法M10的流程圖;
[0048] 圖33B展示任務T10的實施方案T12 ;
[0049] 圖33C展示任務T10的實施方案T14 ;
[0050] 圖33D展示方法M10的實施方案M20的流程圖;
[0051] 圖34A展示方法M20的實施方案M25的流程圖;
[0052] 圖34B展示方法M10的實施方案M30的流程圖;
[0053] 圖34C展示方法M30的實施方案M100的流程圖;
[0054] 圖35A展示方法M100的實施方案M110的流程圖;
[0055] 圖35B展示根據一般配置的設備A5的框圖;
[0056] 圖35C展示設備A5的實施方案A10的框圖;
[0057] 圖3?展示設備A10的實施方案A15的框圖;
[0058] 圖36A展示根據一般配置的設備MF5的框圖;
[0059] 圖36B展示設備MF5的實施方案MF10的框圖;
[0060] 圖36C展示設備MF10的實施方案MF15的框圖;
[0061] 圖37A說明使用裝置來表示在所述裝置的平面中的三維到達方向;
[0062] 圖37B說明表示具有與定位在軸平面外部的點源非正交的軸的麥克風陣列的相 應響應的混淆錐的交叉點;
[0063] 圖37C說明圖37B的圓錐的相交的線;
[0064] 圖38A展示音頻預處理級的框圖;
[0065] 圖38B展示音頻預處理級的三通道實施方案的框圖;
[0066] 圖39A展示包含用于指示到達方向的裝置的設備的實施方案的框圖;
[0067] 圖39B展示由來自線性陣列的D0A估計的單向度產生的模糊性的實例;
[0068] 圖39C說明混淆錐的一個實例;
[0069] 圖40展示其中三個源相對于具有線性麥克風陣列的裝置位于不同相應方向上的 揚聲器電話應用中的源混淆的實例;
[0070] 圖41A展示包含具有正交軸的兩個麥克風對的2-D麥克風陣列;
[0071] 圖41B展示包含多個任務的根據一般配置的方法的流程圖;
[0072] 圖41C展示在顯示器上展示的D0A估計的實例;
[0073] 圖42A展示1-D估計的正負號與由陣列軸界定的平面的對應象限之間的對應關系 的一個實例;
[0074] 圖42B展示1-D估計的正負號與由陣列軸界定的平面的對應象限之間的對應關系 的另一實例;
[0075] 圖42C展示元組(sign( θ x),sign( Θ y))的四個值與平面的象限之間的對應關 系;
[0076] 圖42D展示根據替代性映射的360度顯示器;
[0077] 圖43A展示類似于圖41A但描繪其中源位于x-y平面上方的更一般的情況的實 例;
[0078] 圖43B展示其軸界定x-y平面的2-D麥克風陣列及位于x-y平面上方的源的另一 實例;
[0079] 圖43C展示其中點源在由陣列軸界定的平面上方升高的此一般情況的實例;
[0080] 圖44A到44D展示(θ χ,Θ y)轉換為陣列平面中的角度的推導;
[0081] 圖44E說明投影p及仰角的角度的一個實例;
[0082] 圖45A展示通過應用替代性映射而獲得的曲線圖;
[0083] 圖45B展示與具有與共同點源非正交的軸X及r的線性麥克風陣列的響應相關聯(lián) 的相交的混淆錐的實例;
[0084] 圖45C展示圓錐的交叉點的線;
[0085] 圖46A展示麥克風陣列的實例;
[0086] 圖46B展示使用來自圖46A中所示的陣列的觀測(θ χ,Θ J相對于正交軸X及y 獲得χ-y平面中的組合方向性估計的實例;
[0087] 圖46C說明投影的一個實例;
[0088] 圖46D說明從投影向量的維度確定值的一個實例;
[0089] 圖46E說明從投影向量的維度確定值的另一實例;
[0090] 圖47A展示根據包含任務的實例的另一一般配置的方法的流程圖;
[0091] 圖47B展示包含子任務的任務的實施方案的流程圖;
[0092] 圖47C說明具有用于執(zhí)行對應于圖47A的功能的組件的設備的一個實例;
[0093] 圖47D說明包含用于執(zhí)行對應于圖47A的功能的裝置的設備的一個實例;
[0094] 圖48A展示包含任務的方法的一個實施方案的流程圖;
[0095] 圖48B展示另一方法的實施方案的流程圖;
[0096] 圖49A展示方法的另一實施方案的流程圖;
[0097] 圖49B說明相對于顯示平面的仰角的所估計的角度的指示的一個實例;
[0098] 圖49C展示包含任務的另一方法的此實施方案的流程圖;
[0099] 圖50A及50B展示在旋轉之前及之后的顯示器的實例;
[0100] 圖51A及51B展示在旋轉之前及之后的顯示器的其它實例;
[0101] 圖52A展示其中裝置坐標系E與世界坐標系對準的實例;
[0102] 圖52B展示其中旋轉裝置的實例及對應于定向的矩陣F ;
[0103] 圖52C展示D0A到世界參考平面上的投影的到裝置的顯示平面上的透視映射;
[0104] 圖53A展示投射到世界參考平面上的D0A的映射顯示器的實例;
[0105] 圖53B展示方法的此類另一實施方案的流程圖;
[0106] 圖53C說明包含線性滑塊電位計、搖臂開關及輪或旋鈕的接口的實例;
[0107] 圖54A說明用戶接口的一個實例;
[0108] 圖54B說明用戶接口的另一實例;
[0109] 圖54C說明用戶接口的另一實例;
[0110] 圖55A及55B展示其中使用定向傳感器來跟蹤裝置的定向的另一實例;
[0111] 圖56是說明其中可實施用于映射源位置的系統(tǒng)和方法的電子裝置的一個配置的 框圖;
[0112] 圖57是說明用于映射源位置的方法的一個配置的流程圖;
[0113] 圖58是說明其中可實施用于映射源位置的系統(tǒng)和方法的電子裝置的更特定的配 置的框圖;
[0114] 圖59是說明用于映射源位置的方法的更特定的配置的流程圖;
[0115] 圖60是說明用于基于所述映射執(zhí)行操作的方法的一個配置的流程圖;
[0116] 圖61是說明用于基于所述映射執(zhí)行操作的方法的另一配置的流程圖;
[0117] 圖62是說明其中可實施用于在電子裝置上顯示用戶接口的系統(tǒng)和方法的用戶接 口的一個配置的框圖;
[0118] 圖63是說明用于在電子裝置上顯示用戶接口的方法的一個配置的流程圖;
[0119] 圖64是說明其中可實施用于在電子裝置上顯示用戶接口的系統(tǒng)和方法的用戶接 口的一個配置的框圖;
[0120] 圖65是說明用于在電子裝置上顯示用戶接口的方法的更特定的配置的流程圖;
[0121] 圖66說明用于顯示至少一個音頻信號的方向性的用戶接口的實例;
[0122] 圖67說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0123] 圖68說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0124] 圖69說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0125] 圖70說明用于顯示至少一個音頻信號的方向性的用戶接口的另一實例;
[0126] 圖71說明用戶接口的扇區(qū)選擇特征的實例;
[0127] 圖72說明用戶接口的扇區(qū)選擇特征的另一實例;
[0128] 圖73說明用戶接口的扇區(qū)選擇特征的另一實例;
[0129] 圖74說明用戶接口的扇區(qū)選擇特征的更多實例;
[0130] 圖75說明用戶接口的扇區(qū)選擇特征的更多實例;
[0131] 圖76是說明用于編輯扇區(qū)的方法的一個配置的流程圖;
[0132] 圖77說明用戶接口的扇區(qū)編輯特征的實例;
[0133] 圖78說明用戶接口的扇區(qū)編輯特征的更多實例;
[0134] 圖79說明用戶接口的扇區(qū)編輯特征的更多實例;
[0135] 圖80說明用戶接口的扇區(qū)編輯特征的更多實例;
[0136] 圖81說明用戶接口的扇區(qū)編輯特征的更多實例;
[0137] 圖82說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的實例;
[0138] 圖83說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0139] 圖84說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0140] 圖85說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0141] 圖86說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的更多實例;
[0142] 圖87說明具有獨立于電子裝置定向而定向的坐標系的用戶接口的另一實例;
[0143] 圖88是說明其中可實施用于在電子裝置上顯示用戶接口的系統(tǒng)和方法的用戶接 口的另一配置的框圖;
[0144] 圖89是說明用于在電子裝置上顯示用戶接口的方法的另一配置的流程圖;
[0145] 圖90說明耦合到數(shù)據庫的用戶接口的實例;
[0146] 圖91是說明用于在電子裝置上顯示用戶接口的方法的另一配置的流程圖;
[0147] 圖92是說明其中可實施用于映射源位置的系統(tǒng)和方法的無線通信裝置的一個配 置的框圖;
[0148] 圖93說明可在電子裝置中利用的各種組件;及
[0149] 圖94說明用戶接口的另一實例。
【具體實施方式】
[0150] 第三代合作伙伴計劃(3GPP)是旨在界定在全球范圍內可適用的第三代(3G)移動 電話規(guī)范的電信協(xié)會團體之間的合作。3GPP長期演進(LTE)是旨在提高全球移動電信系統(tǒng) (UMTS)移動電話標準的3GPP計劃。所述3GPP可界定下一代移動網絡、移動系統(tǒng)及移動裝 置的規(guī)范。
[0151] 應注意,在一些情況下,可關于一或多個規(guī)范來描述本文中揭示的系統(tǒng)和方法,例 如 3GPP 版本 8 (Re 1-8)、3GPP 版本 9 (Re 1-9)、3GPP 版本 10 (Re 1 -10)、LTE、LTE 高級(LTE-A)、 全球移動通信系統(tǒng)(GSM)、通用分組無線電服務(GPRS)、GSM演進增強數(shù)據速率(EDGE)、 時分長期演進(TD-LTE)、時分同步碼分多址(TD-SCDMA)、頻分雙工長期演進(FDD-LTE)、 UMTS、GSM EDGE無線電接入網絡(GERAN)、全球定位系統(tǒng)(GPS)等。然而,本文中所描述的 所述概念中的至少一些可應用于其它無線通信系統(tǒng)。舉例來說,術語電子裝置可用于指代 用戶設備(UE)。此外,術語基站可用于指代術語節(jié)點B、演進型節(jié)點B(eNB)、歸屬演進型節(jié) 點B(HeNB)等中的至少一者。
[0152] 除非受其上下文明確地限制,否則術語"信號"在本文中用以指示其普通意義中的 任一者,包含如在導線、總線或其它傳輸媒體上表達的存儲器位置(或存儲器位置集合)的 狀態(tài)。除非受其上下文明確地限制,否則本文中使用術語"產生"來指示其普通意義中的任 一者,例如計算或以其它方式產生。除非受其上下文明確地限制,否則術語"計算"在本文 中用以指示其普通意義中的任一者,例如計算、評估、估計和/或從多個值中進行選擇。除 非受其上下文明確地限制,否則使用術語"獲得"來指示其普通意義中的任一者,例如推算、 導出、接收(例如,從外部裝置)和/或檢索(例如,從存儲元件陣列)。除非受其上下文 明確地限制,否則使用術語"選擇"來指示其普通意義中的任一者,例如識別、指示、應用和 /或使用一組兩者或兩者以上中的至少一者和少于全部。除非受其上下文明確地限制,否 則本文中使用術語"確定"來指示其普通意義中的任一者,例如決定、建立、推斷、推算、選擇 和/或評估。在術語"包括"用于本描述及權利要求書中的情況下,其不排除其它元件或操 作。使用術語"基于"(如在"A是基于B"中)來指示其普通意義中的任一者,包含以下情 況(i) "從中導出"(例如,"B是A的前驅體"至少基于"(例如,"A至少基于B") 以及,在特定上下文中在適當?shù)那闆r下,(iii) "等于"(例如,"A等于B"或"A與B相同")。 類似地,使用術語"響應于"來指示其普通意義中的任一者,包含"至少響應于"。除非另有 指示,否則術語"A、B及C中的至少一者"及"A、B及C中的一或多者"指示"A和/或B和 / 或 C"。
[0153] 對多麥克風音頻感測裝置的麥克風的"位置"的參考指示所述麥克風的聲敏感面 的中心的位置,除非上下文另有指示。根據特定上下文,有時使用術語"通道"來指示信號路 徑且在其它時候指示由此路徑載運的信號。除非另有指示,否則使用術語"系列"來指示兩 個或兩個以上項目的序列。使用術語"對數(shù)"來指示基數(shù)為十的對數(shù),但將此運算擴展到其 它基數(shù)在本發(fā)明的范圍內。使用術語"頻率分量"來指示信號的一組頻率或頻帶中的一者, 例如(例如,由快速傅里葉變換產生非)信號的頻域表示的樣本(或"二進位")或信號的 子帶(例如,巴克(Bark)尺度或梅爾(mel)尺度子帶)。
[0154] 除非另有指示,否則對具有特定特征的設備的操作的任何揭示內容還明確地希望 揭示具有類似特征的方法(且反之亦然),且對根據特定配置的設備的操作的任何揭示內 容還明確地希望揭示根據類似配置的方法(且反之亦然)。術語"配置"可參考由其特定上 下文指示的方法、設備和/或系統(tǒng)來使用。術語"方法"、"過程"、"程序"和"技術"通用地且 可互換地使用,除非特定上下文另有指示。具有多個子任務的"任務"也是方法。術語"設 備"和"裝置"也通用地且可互換地使用,除非特定上下文另有指示。術語"元件"和"模塊" 通常用以指示較大配置的一部分。除非由其上下文明確限制,否則術語"系統(tǒng)"在此用以指 示其普通意義中的任一者,包含"交互以用于共同目的的元件群組"。
[0155] 通過參考文獻的一部分的任何并入也應理解為并入了在所述部分內參考的術語 或變量的定義,其中此些定義出現(xiàn)在文獻中的其它地方,以及并入了在所并入部分中參考 的任何圖。除非起初通過定冠詞引入,否則用于修飾權利要求元素的序數(shù)術語(例如,"第 一"、"第二"、"第三"等)本身不指示所述權利要求元素相對于另一權利要求元素的任何優(yōu) 先級或次序,而是僅區(qū)別所述權利要求元素與具有同一名稱(如果沒有序數(shù)術語)的另一 權利要求元素。除非通過其上下文明確地限制,否則術語"多個"及"集合"中的每一者在 本文中用以指示大于一的整數(shù)數(shù)量。
[0156] A.用于估計到達方向的系統(tǒng)、方法和設備
[0157] 一種處理多通道信號的方法包含對于所述多通道信號的多個不同頻率分量中的 每一者,計算所述多通道信號的第一對通道中的每一者中的頻率分量的相位之間的差,以 獲得多個相位差。此方法還包含對于多個候選方向中的每一者,估計候選方向與基于所述 多個相位差的向量之間的誤差。此方法還包含從所述多個候選方向當中選擇對應于所估計 誤差當中的最小誤差的候選方向。在此方法中,所述第一對通道中的每一者是基于由第一 對麥克風中的對應麥克風產生的信號,且不同頻率分量中的至少一者具有小于所述第一對 麥克風中的麥克風之間的距離的兩倍的波長。
[0158] 可假設,在發(fā)射聲場的近場和遠場區(qū)中,波前分別為球面的和平面的??蓪⒔鼒龆?義為距聲接收器(例如,麥克風陣列)小于一個波長的空間區(qū)。在此定義下,到區(qū)邊界的距 離與頻率成反比地變化。在200、700和2000赫茲的頻率下,例如,到一個波長邊界的距離 分別為約170厘米、49厘米和17厘米。改為考慮近場/遠場邊界處于距麥克風陣列特定距 離處(例如,距陣列的麥克風或距陣列的質心50厘米,或距陣列的麥克風或距陣列的質心 1米或1. 5米)可為有用的。
[0159] 現(xiàn)參看圖描述各種配置,在各圖中,相似參考數(shù)字可指示功能上類似的元件??梢?廣泛多種不同配置來布置及設計如本文中在各圖中所大體描述及說明的系統(tǒng)和方法。因 此,對如各圖中所表示的若干配置的以下更詳細描述并不希望限制如所主張的范圍,而僅 表示系統(tǒng)和方法。圖中所描繪的特征和/或元素可組合至少一個其它圖中所描繪的至少一 個特征和/或元素。
[0160] 圖1展不多麥克風手持機H100 (例如,多麥克風裝直)的實例,所述多麥克風手持 機包含軸線在裝置的正面的左右方向上的第一麥克風對MV10-1、MV10-3,和軸線在前后方 向上(即,正交于正面)的第二麥克風對MV10-UMV10-2。此類布置可用以確定用戶何時 在裝置的正面說話(例如,瀏覽-通話模式)。前后對可用以解決左右對通常無法就其本身 來解決的前后方向之間的模糊性。在一些實施方案中,手持機H100可包含一或多個擴音器 LS10、L20L、LS20R、觸摸屏TS10、鏡頭L10和/或一或多個額外麥克風ME10、MR10。
[0161] 除如圖1中所展示的手持機之外,可實施以包含多麥克風陣列及執(zhí)行如本文中所 描述的方法的音頻感測裝置的其它實例還包含便攜式計算裝置(例如,膝上型計算機、筆 記型計算機、上網本計算機、超便攜式計算機、平板計算機、移動因特網裝置、智能筆記本、 智能電話等)、音頻或視頻會議裝置,及顯示屏幕(例如,計算機監(jiān)視器、電視機)。
[0162] 如圖1中所展示的裝置可經配置以通過以下操作來確定源信號的到達方向 (D0A):測量每一頻段的麥克風通道之間的差異(例如,相位差)以獲得方向指示,及將所有 頻段內的方向指示平均化以確定所估計方向是否在所有頻段上一致??捎糜诟櫟念l段的 范圍通常受麥克風對的空間混疊頻率約束??蓪⒋松舷薅x為信號的波長為麥克風之間的 距離d的兩倍所在的頻率。此類方法可能不支持對超出一米的源D0A的準確跟蹤且通???能僅支持低DOA分辨率。此外,對依賴前后對解決模糊性的相依性可能為對麥克風放置幾 何布置的顯著約束,這是因為將裝置放置在表面上可有效地遮擋前麥克風或后麥克風。此 類方法通常還僅使用一個固定對來用于跟蹤。
[0163] 可能需要提供一種通用揚聲器電話應用,以使得可任意地放置多麥克風裝置(例 如,放置在電話會議的表格上、放置在汽車座椅上等)且跟蹤及/或提高個人說話者的話 音。此類方法可能能夠關于可用麥克風的任意定向處置任意目標說話者位置。還可能需要 此類方法提供瞬時多說話者跟蹤/分離能力。不幸的是,當前現(xiàn)有技術水平為單麥克風方 法。
[0164] 還可能需要支持遠場應用中的源跟蹤,所述源跟蹤可用以提供用于跟蹤處于大距 離處且關于多麥克風裝置定向未知的源的解決方案。此類應用中的多麥克風裝置可包含安 裝于電視機或機頂盒上的可用以支持電話的陣列。實例包含Kinect裝置陣列(微軟公司, 雷蒙德華盛頓州)和Skype陣列(微軟Skype分部)及三星電子(韓國漢城)。除大的源 到裝置距離之外,此類應用通常還遭受不良信號對干擾加噪聲比(SINR)和房間混響。
[0165] 挑戰(zhàn)是提供一種用于針對同時發(fā)生的多個聲音事件估計音頻信號的每一幀的三 維到達方向(D0A)的方法,所述音頻信號在背景噪聲和混響下足夠穩(wěn)健??赏ㄟ^將可靠頻 段的數(shù)目最大化來獲得穩(wěn)健性??赡苄枰祟惙椒ㄟm合于任意成形的麥克風陣列幾何布 置,以使得可避免對麥克風幾何布置的特定約束??蓪⑷绫疚乃枋龅某蓪?-D方法適當 地并入到任何幾何布置中。
[0166] 本文中所揭示的系統(tǒng)和方法可針對此類通用揚聲器電話應用或遠場應用來實施。 可實施此類方法以在無麥克風放置約束的情況下操作。還可實施此類方法以使用上達尼奎 斯特頻率及下到較低頻率的可用頻段來跟蹤源(例如,通過支持使用具有較大麥克風間距 離的麥克風對)。不是限于單對用于跟蹤,而是,可實施此類方法以在所有可用對當中選擇 最好的對。此類方法可用以支持甚至遠場情境(高達3米到5米或大于5米的距離)中的 源跟蹤,及提供高得多的D0A分辨率。其它可能的特征包含獲得作用中源的確切2-D表示。 對于最好的結果,可能需要每一源為稀疏寬帶音頻源,且每一頻段大部分受不超過一個源 支配。
[0167] 圖33A展示根據一般配置的包含任務TKKT20和T30的方法M10的流程圖。任務 T10計算多通道信號的一對通道之間的差異(例如,其中每一通道是基于由對應麥克風產 生的信號)。對于多個(K個)候選方向當中的每一者,任務T20計算基于所計算的差異的 對應方向誤差?;贙個方向誤差,任務T30選擇候選方向。
[0168] 方法M10可經配置以將多通道信號作為一連串片段來處理。典型片段長度的范圍 為從約5或10毫秒到約40或50毫秒,且所述片段可為重疊的(例如,與鄰近片段重疊達 25%或50%)或非重疊的。在一個特定實例中,將多通道信號劃分成一連串非重疊片段或 "幀",每一者的長度為10毫秒。在另一特定實例中,每一幀的長度為20毫秒。如通過方法 M10處理的片段還可為如通過不同操作處理的較大片段(即,子幀),或反過來也是一樣。
[0169] 通道之間的差異的實例包含增益差或比率、到達時間差和相位差。舉例來說,可實 施任務T10以將一對通道之間的差異計算為所述通道的對應增益值之間的差或比率(例 如,量值或能量差)。圖33B展示任務T10的此類實施方案T12。
[0170] 可實施任務T12以計算時域(例如,對于信號的多個子帶中的每一者)或頻域(例 如,對于變換域中的信號的多個頻率分量中的每一者,例如,快速傅里葉變換(FFT)、離散余 弦變換(DCT)或經修改的DCT(MDCT)域)中的多通道信號的片段的增益的量度。此類增益 量度的實例包含(不限于)以下各者:總量值(例如,樣本值的絕對值總和)、平均量值(例 如,每一樣本)、均方根(RMS)幅度、中值量值、峰值量值、峰值能量、總能量(例如,樣本值的 平方總和),及平均能量(例如,每一樣本)。
[0171] 為了在增益差技術情況下獲得準確結果,可能需要將兩個麥克風通道的響應相對 于彼此進行校準??赡苄枰獙⒌屯V波器應用于多通道信號以使得增益量度的計算限于多 通道信號的音頻頻率分量。
[0172] 可實施任務T12以將增益之間的差計算為對數(shù)域(例如,以分貝來計的值)中的 每一通道的對應增益量度值之間的差或等效地計算為線性域中的增益量度值之間的比率。 對于經校準的麥克風對,可采用零增益差來指示源距每一麥克風等距(即,位于所述對的 邊射方向),可采用具有較大正值的增益差來指示源更接近一個麥克風(即,位于所述對的 一個端射方向),且可采用具有較大負值的增益差來指示源更接近另一麥克風(即,位于所 述對的另一端射方向)。
[0173] 在另一實例中,可實施圖33A的任務T10以執(zhí)行通道的相交相關以確定距離(例 如,基于多通道信號的通道之間的滯后計算到達時間差)。
[0174] 在另一實例中,實施任務T10以將一對通道之間的差異計算為每一通道的相位之 間的差(例如,信號的特定頻率分量下)。圖33C展示任務T10的此類實施方案T14。如下 文所論述,可對于多個頻率分量當中的每一者執(zhí)行此類計算。
[0175] 對于由一對麥克風直接從相對于麥克風對的軸線的特定到達方向(D0A)的點源 接收的信號,對于每一頻率分量,相位延遲不同,而且取決于麥克風之間的間隔??蓪⑻囟?頻率分量(或"頻段")下的相位延遲的所觀測值計算為復數(shù)FFT系數(shù)的虛數(shù)項與復數(shù)FFT 系數(shù)的實數(shù)項的比率的反正切(還被稱為反正切(arctangent))。
[0176] 如圖2A中所展示,特定頻率f下的至少一個麥克風MC10、MC20的源SOI的相位延 遲值Δ&可與遠場(即,平面波)(假設下的源D0A相關,如
【權利要求】
1. 一種用于通過電子裝置映射源位置的方法,其包括: 獲得傳感器數(shù)據; 基于所述傳感器數(shù)據將源位置映射到電子裝置坐標; 將所述源位置從所述電子裝置坐標映射到物理坐標;及 基于映射而執(zhí)行操作。
2. 根據權利要求1所述的方法,其中執(zhí)行所述操作包括將所述源位置從所述物理坐標 映射到三維顯示空間中。
3. 根據權利要求1所述的方法,其中執(zhí)行所述操作包括在三維顯示空間中維持源定向 而不管裝置定向如何。
4. 根據權利要求1所述的方法,其中所述物理坐標包括對應于地球坐標的二維平面。
5. 根據權利要求1所述的方法,其中所述傳感器數(shù)據是從由以下各者組成的群組中的 至少一者獲得:一或多個麥克風、加速度計、陀螺儀、羅盤、紅外線傳感器、接近度傳感器、相 機、全球定位系統(tǒng)接收器,及超聲傳感器。
6. 根據權利要求1所述的方法,其進一步包括基于所述傳感器數(shù)據而確定電子裝置定 向。
7. 根據權利要求1所述的方法,其進一步包括基于所述傳感器數(shù)據而檢測電子裝置定 向中的任何變化。
8. 根據權利要求1所述的方法,其進一步包括檢測在電子裝置定向與參考定向之間是 否存在差異。
9. 根據權利要求1所述的方法,其中執(zhí)行操作包括切換到將所述物理坐標中的源的空 間分辨率最大化的電子裝置麥克風配置。
10. 根據權利要求1所述的方法,其中執(zhí)行操作包括基于所述映射而在三個維度中跟 蹤源。
11. 根據權利要求10所述的方法,其中所述源位置對應于音頻源。
12. 根據權利要求10所述的方法,其進一步包括將所述源位置投影到二維空間中。
13. 根據權利要求12所述的方法,其進一步包括切換到在所述二維空間中在兩個維度 中進行跟蹤。
14. 根據權利要求1所述的方法,其中執(zhí)行操作包括獨立于電子裝置定向而執(zhí)行非靜 態(tài)噪聲抑制。
15. 根據權利要求1所述的方法,其中所述電子裝置包括三個麥克風且能夠區(qū)別360度 內的音頻信號。
16. 根據權利要求1所述的方法,其中所述電子裝置包括兩個麥克風且能夠區(qū)別180度 內的音頻信號。
17. -種用于通過電子裝置映射源位置的電子裝置,其包括: 至少一個傳感器,其獲得傳感器數(shù)據; 映射器電路,其耦合到所述至少一個傳感器,其中所述映射器電路基于所述傳感器數(shù) 據將源位置映射到電子裝置坐標且將所述源位置從所述電子裝置坐標映射到物理坐標;及 操作電路,其耦合到所述映射器電路,其中所述操作電路基于映射而執(zhí)行操作。
18. 根據權利要求17所述的電子裝置,其中執(zhí)行所述操作包括將所述源位置從所述物 理坐標映射到三維顯示空間中。
19. 根據權利要求17所述的電子裝置,其中執(zhí)行所述操作包括在三維顯示空間中維持 源定向而不管裝置定向如何。
20. 根據權利要求17所述的電子裝置,其中所述物理坐標包括對應于地球坐標的二維 平面。
21. 根據權利要求17所述的電子裝置,其中所述傳感器數(shù)據是從由以下各者組成的群 組中的至少一者獲得:一或多個麥克風、加速度計、陀螺儀、羅盤、紅外線傳感器、接近度傳 感器、相機、全球定位系統(tǒng)接收器,及超聲傳感器。
22. 根據權利要求17所述的電子裝置,其中所述映射器電路基于所述傳感器數(shù)據而確 定電子裝置定向。
23. 根據權利要求17所述的電子裝置,其中所述映射器電路基于所述傳感器數(shù)據而檢 測電子裝置定向中的任何變化。
24. 根據權利要求17所述的電子裝置,其中所述操作電路檢測在電子裝置定向與參考 定向之間是否存在差異。
25. 根據權利要求17所述的電子裝置,其中執(zhí)行操作包括切換到將所述物理坐標中的 源的空間分辨率最大化的電子裝置麥克風配置。
26. 根據權利要求17所述的電子裝置,其中執(zhí)行操作包括基于所述映射而在三個維度 中跟蹤源。
27. 根據權利要求26所述的電子裝置,其中所述源位置對應于音頻源。
28. 根據權利要求26所述的電子裝置,其中所述操作電路將所述源位置投影到二維空 間中。
29. 根據權利要求28所述的電子裝置,其中所述操作電路切換到在所述二維空間中在 兩個維度中進行跟蹤。
30. 根據權利要求17所述的電子裝置,其中執(zhí)行操作包括獨立于電子裝置定向而執(zhí)行 非靜態(tài)噪聲抑制。
31. 根據權利要求17所述的電子裝置,其中所述電子裝置包括三個麥克風且能夠區(qū)別 360度內的音頻信號。
32. 根據權利要求17所述的電子裝置,其中所述電子裝置包括兩個麥克風且能夠區(qū)別 180度內的音頻信號。
33. -種用于映射源位置的計算機程序產品,其包括上面具有指令的非暫時性有形計 算機可讀媒體,所述指令包括: 用于致使電子裝置獲得傳感器數(shù)據的代碼; 用于致使所述電子裝置基于所述傳感器數(shù)據將源位置映射到電子裝置坐標的代碼; 用于致使所述電子裝置將所述源位置從所述電子裝置坐標映射到物理坐標的代碼;及 用于致使所述電子裝置基于映射而執(zhí)行操作的代碼。
34. 根據權利要求33所述的計算機程序產品,其中執(zhí)行所述操作包括將所述源位置從 所述物理坐標映射到三維顯示空間中。
35. 根據權利要求33所述的計算機程序產品,其中執(zhí)行所述操作包括在三維顯示空間 中維持源定向而不管裝置定向如何。
36. 根據權利要求33所述的計算機程序產品,其中所述物理坐標包括對應于地球坐標 的二維平面。
37. 根據權利要求33所述的計算機程序產品,其中所述傳感器數(shù)據是從由以下各者組 成的群組中的至少一者獲得:一或多個麥克風、加速度計、陀螺儀、羅盤、紅外線傳感器、接 近度傳感器、相機、全球定位系統(tǒng)接收器,及超聲傳感器。
38. 根據權利要求33所述的計算機程序產品,其中所述指令進一步包括用于致使所述 電子裝置基于所述傳感器數(shù)據而確定電子裝置定向的代碼。
39. 根據權利要求33所述的計算機程序產品,其中所述指令進一步包括用于致使所述 電子裝置基于所述傳感器數(shù)據而檢測電子裝置定向中的任何變化的代碼。
40. 根據權利要求33所述的計算機程序產品,其中所述指令進一步包括用于致使所述 電子裝置檢測在電子裝置定向與參考定向之間是否存在差異的代碼。
41. 根據權利要求33所述的計算機程序產品,其中執(zhí)行操作包括切換到將所述物理坐 標中的源的空間分辨率最大化的電子裝置麥克風配置。
42. -種用于映射源位置的設備,其包括: 用于獲得傳感器數(shù)據的裝置; 用于基于所述傳感器數(shù)據將源位置映射到電子裝置坐標的裝置; 用于將所述源位置從所述電子裝置坐標映射到物理坐標的裝置;及 用于基于映射而執(zhí)行操作的裝置。
43. 根據權利要求42所述的設備,其中執(zhí)行所述操作包括將所述源位置從所述物理坐 標映射到三維顯示空間中。
44. 根據權利要求42所述的設備,其中執(zhí)行所述操作包括在三維顯示空間中維持源定 向而不管裝置定向如何。
45. 根據權利要求42所述的設備,其中所述物理坐標包括對應于地球坐標的二維平 面。
46. 根據權利要求42所述的設備,其中所述傳感器數(shù)據是從由以下各者組成的群組中 的至少一者獲得:一或多個麥克風、加速度計、陀螺儀、羅盤、紅外線傳感器、接近度傳感器、 相機、全球定位系統(tǒng)接收器,及超聲傳感器。
47. 根據權利要求42所述的設備,其進一步包括用于基于所述傳感器數(shù)據而確定電子 裝置定向的裝置。
48. 根據權利要求42所述的設備,其進一步包括用于基于所述傳感器數(shù)據而檢測電子 裝置定向中的任何變化的裝置。
49. 根據權利要求42所述的設備,其進一步包括用于檢測在電子裝置定向與參考定向 之間是否存在差異的裝置。
50. 根據權利要求42所述的設備,其中執(zhí)行操作包括切換到將所述物理坐標中的源的 空間分辨率最大化的電子裝置麥克風配置。
【文檔編號】G01S15/87GK104272137SQ201380019298
【公開日】2015年1月7日 申請日期:2013年4月10日 優(yōu)先權日:2012年4月13日
【發(fā)明者】金萊軒, E·維瑟, P·L·通, J·P·托曼, J·C·邵 申請人:高通股份有限公司