專利名稱:用于由分布式部件自動(dòng)搜索的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于進(jìn)行自動(dòng)搜索的系統(tǒng)和方法。更具體的,本發(fā)明涉及用于以自主代理(autonomous agent)執(zhí)行自動(dòng)地理搜索的系統(tǒng)和方法。
背景技術(shù):
機(jī)器人越來越多地用于枯燥、骯臟和危險(xiǎn)的工作中。對于許多不同的應(yīng)用而言,需要有一種用于在協(xié)作任務(wù)中控制3到20個(gè)機(jī)器人組的系統(tǒng)或方法,并具有最少的人為監(jiān)管。機(jī)器人組被用于在水下徹底地搜索海灣中的水雷,并且搜索者使用機(jī)器人監(jiān)視海洋化學(xué)物質(zhì)的變化。NASA正在考慮可能使用機(jī)器人組的任務(wù)。商業(yè)機(jī)器人變得更便宜,并將被用于調(diào)查、搜索和營救,以及其它應(yīng)用。
在這點(diǎn)上,機(jī)器人通常由一個(gè)集中系統(tǒng)來控制。集中計(jì)劃人員通常確定如何在機(jī)器人中劃分工作,并以特定的協(xié)調(diào)基本數(shù)據(jù)單元(primitive)來分配任務(wù)。每個(gè)機(jī)器人都在搜索空間具有一個(gè)狀態(tài)。與每個(gè)機(jī)器人的位置有關(guān)的數(shù)據(jù)必須傳送到集中處理器,用于協(xié)調(diào)分析并傳送回機(jī)器人。
這種集中方法是帶寬密集的,因此不易于量測。這限制了該方法用于更多所要求的當(dāng)前和將來的應(yīng)用。
因此,在本技術(shù)領(lǐng)域中需要一種分散的方法,其允許機(jī)器人自主地但協(xié)作地運(yùn)行,且在它們之間具有最少的數(shù)據(jù)流。
發(fā)明內(nèi)容
在本技術(shù)領(lǐng)域中的該需求由本發(fā)明來解決,其提供了一種有效的自動(dòng)分布式搜索機(jī)制,用于任何要求對數(shù)據(jù)空間進(jìn)行搜索以尋找特定類型的目標(biāo)/對象的應(yīng)用。在最通常的實(shí)施中,本發(fā)明的系統(tǒng)包括探測器,用于探測所關(guān)注的對象;模型,用于預(yù)測該對象的行為;及機(jī)制,用于響應(yīng)于模型的數(shù)據(jù)輸出,將探測器指引到對象。
在一個(gè)特定應(yīng)用中,本發(fā)明的系統(tǒng)布置在多個(gè)移動(dòng)平臺上。平臺可以是機(jī)器人、無人駕駛飛行器(UAV)或作為實(shí)例的移動(dòng)數(shù)據(jù)結(jié)構(gòu)。在最佳模式中,模型是預(yù)測模型,適于以一組質(zhì)點(diǎn)的形式提供對象或目標(biāo)的概率分布特征。這些質(zhì)點(diǎn)被移動(dòng)以反映對象的行為??梢园ǘ鄠€(gè)模型以解釋所述對象的其它假設(shè)身份或特征。當(dāng)接收到對象行為和/或特征(例如位置)的更新時(shí),在每個(gè)移動(dòng)平臺中的模型也被相應(yīng)的更新。這些質(zhì)點(diǎn)被分組到群集(cluster)中,每個(gè)機(jī)器人被指定在各自群集的質(zhì)心開始其搜索。
圖1是示出根據(jù)本說明的每個(gè)機(jī)器人的通信功能行為的說明性實(shí)施的流程圖;圖2是示出根據(jù)本說明的說明性實(shí)施例的每個(gè)機(jī)器人所執(zhí)行的傳感器管理功能的流程圖;圖3是根據(jù)本說明的每個(gè)機(jī)器人所執(zhí)行的移動(dòng)控制的說明性方法的流程圖;圖4是根據(jù)本說明的移動(dòng)控制方法的可替換實(shí)施;圖5示出了適于實(shí)現(xiàn)本發(fā)明的說明性的機(jī)器人控制體系結(jié)構(gòu)的框圖;圖6是根據(jù)本說明的在信息更新幾分鐘后的模擬情況;圖7是根據(jù)本說明的在信息更新十分鐘后的模擬情況;以及圖8是對圖6和7中所示情況的仿真的屏幕截圖。
具體實(shí)施例方式
現(xiàn)在將參照附圖來對說明性的實(shí)施例和示例性的應(yīng)用加以說明,以公開本發(fā)明有利的說明。
盡管在此參照用于特定應(yīng)用的說明性實(shí)施例來描述本發(fā)明,但應(yīng)理解本發(fā)明并不限于此。本領(lǐng)域技術(shù)人員獲取了在此提供的說明之后,會認(rèn)知在其范圍內(nèi)的其他修改、應(yīng)用和實(shí)施例,以及本發(fā)明具有顯著效用的其他領(lǐng)域。
根據(jù)本說明,以質(zhì)點(diǎn)的動(dòng)態(tài)群集表示對象存在的概率。每個(gè)質(zhì)點(diǎn)(其僅存在于存儲器內(nèi))具有相同的恒定值,因此密集的質(zhì)點(diǎn)群集意謂著在該區(qū)域中存在對象的高概率。當(dāng)獲知了一個(gè)新對象的可能性時(shí),每個(gè)機(jī)器人在其存儲器內(nèi)在其自己的區(qū)域地圖上產(chǎn)生質(zhì)點(diǎn)分布。如果它得到以前被告知的對象的更新時(shí),它按照表示新信息的需要調(diào)整質(zhì)點(diǎn)分布。質(zhì)點(diǎn)具有類型,還可以具有優(yōu)先級或權(quán)重。
每個(gè)機(jī)器人從系統(tǒng)用戶處接收周期性的更新,包括與一個(gè)或多個(gè)已知或可疑對象有關(guān)的概率信息,機(jī)器人被分派任務(wù)以尋找該對象并識別它。更新可以包括對象可能屬于的一個(gè)或多個(gè)可能的分類,每一個(gè)都具有相關(guān)的非零似然性。例如,移動(dòng)對象可以是坦克(30%的可能性),或轎車(60%),或校車(10%)。如果沒有傳送分類,機(jī)器人會對每個(gè)可能性給予相等的似然性。每個(gè)接收到該消息的機(jī)器人會產(chǎn)生一個(gè)概率質(zhì)點(diǎn)群集來表示每個(gè)可能性。例如,對象表示坦克的30%的概率導(dǎo)致了在存儲器中產(chǎn)生坦克類的30個(gè)質(zhì)點(diǎn),其可能是與在對象被見到的地圖上的位置有關(guān)的偽高斯分布。同樣,將會在同一位置產(chǎn)生60個(gè)轎車類質(zhì)點(diǎn)和10個(gè)大客車類質(zhì)點(diǎn)。
此后機(jī)器人會周期性地運(yùn)行一個(gè)行為模型(例如,多假設(shè)質(zhì)點(diǎn)濾波器),其將根據(jù)其類型,在該模型預(yù)測的該類型對象的移動(dòng)方向上移動(dòng)每個(gè)質(zhì)點(diǎn),并帶有一定隨機(jī)性。因此,大客車質(zhì)點(diǎn)通常會向附近的學(xué)校移動(dòng),盡管在缺乏周期性更新的情況下它們會向房屋或更遠(yuǎn)學(xué)校散開。
根據(jù)本發(fā)明,每個(gè)機(jī)器人都被吸引到密集的質(zhì)點(diǎn)區(qū)域;這驅(qū)使了機(jī)器人的搜索行為。每個(gè)機(jī)器人獨(dú)立地在其自己的存儲器中將這些質(zhì)點(diǎn)進(jìn)行群集,并選擇一個(gè)群集來進(jìn)行搜索。機(jī)器人通過使用用于產(chǎn)生并移動(dòng)質(zhì)點(diǎn)的同一算法,還通過模擬彼此的行為來協(xié)調(diào)它們的搜索,所述彼此的行為是通過與它們位置有關(guān)的不經(jīng)常的消息來更新的。這種模擬方法減少了算法對精確通信的依賴性。每個(gè)機(jī)器人用產(chǎn)生K個(gè)群集,每個(gè)機(jī)器人一個(gè)群集的群集技術(shù)將敵人或目標(biāo)概率質(zhì)點(diǎn)進(jìn)行群集。K均值是此種群集技術(shù)的簡單實(shí)例,盡管更智能的和自適應(yīng)性的群集技術(shù)可以得到更好的性能。每個(gè)機(jī)器人采用平均值與它們當(dāng)前位置最接近的群集。實(shí)際上,機(jī)器人選擇唯一的搜索任務(wù)分配,其由質(zhì)點(diǎn)的位置來表示。
當(dāng)飛行器搜索一個(gè)區(qū)域時(shí),在此區(qū)域中的任何質(zhì)點(diǎn)都會在一段時(shí)間內(nèi)從其內(nèi)部地圖中移去。這些質(zhì)點(diǎn)稍后會返回到該內(nèi)部地圖中,除非發(fā)現(xiàn)對象。本發(fā)明還使用了在應(yīng)該對其保持監(jiān)視的地理區(qū)域上的質(zhì)點(diǎn)的靜態(tài)類。這種質(zhì)點(diǎn)不移動(dòng),并且總是在被移去一段固定時(shí)間后又復(fù)原。
對本發(fā)明的目的來說,術(shù)語“機(jī)器人”應(yīng)該意謂著具有移動(dòng)性、傳感器和通信能力的定位自主代理。機(jī)器人可以位于任意類型的維度空間中(例如,數(shù)據(jù)庫)。路線跟蹤,障礙物回避,及傳感器管理由本發(fā)明的算法所依據(jù)的下層程序來管理。本發(fā)明做出與向何處去有關(guān)的上層決定,但并不試圖提供與如何到達(dá)那里有關(guān)的細(xì)節(jié)。對本發(fā)明的目的來說,術(shù)語“對象”應(yīng)該意謂著要被搜索的所關(guān)注的某物。對象可以是固定的,比如建筑物,或者是移動(dòng)的,如車輛。其可以有也可以沒有已知的身份。在此提供的大部分實(shí)例是假設(shè)身份是不確定的,且搜索的目的是識別該對象。當(dāng)對象是諸如建筑物之類的固定物體時(shí),通常其身份僅是次要的。將會進(jìn)入或離開該建筑物的實(shí)體(entity)是要主要關(guān)注的。
在一個(gè)說明性實(shí)施例中,本發(fā)明的方法包括在圖1-4中所圖示的步驟。在圖1-4中所示的方法表示在每個(gè)機(jī)器人上并行進(jìn)行的行為,每個(gè)行為都運(yùn)行在“質(zhì)點(diǎn)存儲器”上,其在稱為“位置地圖”的本地?cái)?shù)據(jù)結(jié)構(gòu)中。
圖1是示出根據(jù)本說明的每個(gè)機(jī)器人的通信功能行為的說明性實(shí)施的流程圖。方法10包括監(jiān)視無線電通信的步驟12。在剛一接收到消息時(shí),該方法在其步驟14檢查在該消息中的對象更新。由于每個(gè)機(jī)器人在更新之間都模擬其隊(duì)友的移動(dòng),一旦其確實(shí)接收到更新,它將必須更正該隊(duì)友的位置。由于隨著隊(duì)友的移動(dòng),它還移去了質(zhì)點(diǎn)以反映已經(jīng)搜索過的區(qū)域,如果隊(duì)友的更新與該模型顯著不同,則該機(jī)器人還將必須更正質(zhì)點(diǎn)分布。因此,如果在步驟16沒有接收到對象的更新,則該方法檢查與隊(duì)友位置有關(guān)的更新。如果該消息是隊(duì)友位置的更新,那么在步驟18,更新隊(duì)友位置。如果不是,系統(tǒng)就繼續(xù)監(jiān)視無線電通信。
另一方面,如果該消息包括對象的更新,則該方法檢查以明確這是否是當(dāng)前模擬的對象。如果是,那么在步驟20按照需要移動(dòng)與當(dāng)前模擬的對象有關(guān)的質(zhì)點(diǎn),作為減小的不確定性的結(jié)果,其減小了離散度(dispersion)。否則,在步驟22,對于每個(gè)新的假設(shè)產(chǎn)生一個(gè)質(zhì)點(diǎn)群集。在此連接中,“質(zhì)點(diǎn)移動(dòng)”指根據(jù)對象身份的每個(gè)假設(shè)的移動(dòng)方式的某個(gè)模型來移動(dòng)表示對象的概率分布的過程。例如,多假設(shè)質(zhì)點(diǎn)濾波器(如在雷達(dá)跟蹤文獻(xiàn)中所述)將是可以實(shí)現(xiàn)此目的的一種方式。當(dāng)接收到新信息時(shí)由于不確定性減小了,質(zhì)點(diǎn)離散度也減小。
圖2是示出根據(jù)本說明的說明性實(shí)施例的每個(gè)機(jī)器人所執(zhí)行的傳感器管理功能的流程圖。傳感器管理功能和通信功能兩者都作用在概率質(zhì)點(diǎn)的總體上。如在圖5中所示及在以下的體系結(jié)構(gòu)部分所述的,傳感器管理功能和通信功能并行工作,在質(zhì)點(diǎn)存儲器上獨(dú)立運(yùn)行。如下所述,移動(dòng)控制功能受到這些質(zhì)點(diǎn)的影響。在圖2中,在步驟32,機(jī)器人檢查其傳感器。在步驟34,如果沒有發(fā)現(xiàn)對象,那么在步驟36,系統(tǒng)通過根據(jù)效率概率移去在其傳感器覆蓋區(qū)(footprint)下的那些質(zhì)點(diǎn),來更新其質(zhì)點(diǎn)。
另一方面,在步驟34,如果發(fā)現(xiàn)了對象,那么在步驟38,系統(tǒng)決定是否跟蹤該對象。如果系統(tǒng)決定跟蹤該對象,那么在步驟40,所有相關(guān)的質(zhì)點(diǎn)都被轉(zhuǎn)換到所發(fā)現(xiàn)的對象的類型。如果系統(tǒng)決定不跟蹤該對象,所有與對象有關(guān)的質(zhì)點(diǎn)都被刪除。是否跟蹤的決定最終由用戶做出,或者通過明確的通信,或者是隱含地,如為某種對象類型或環(huán)境條件所定義的策略。根據(jù)本說明,并行執(zhí)行移動(dòng)和傳感。這些機(jī)器人子系統(tǒng)通過作用于質(zhì)點(diǎn)存儲器而間接地通信。
質(zhì)點(diǎn)管理根據(jù)本說明,用于組員之間的通信需求被最小化,并且如果通信中斷,搜索性能會適度地降低。這是由于每個(gè)組員都模擬所有其它組員,并且一旦在視覺上或者是通過通信而證實(shí)了一個(gè)位置,就更新該模型。暫時(shí)的通信中斷意謂著隨著時(shí)間的過去,隊(duì)友模型的預(yù)測會偏離隊(duì)友飛行器的實(shí)際移動(dòng)。該偏離是飛行器速度和機(jī)動(dòng)性、遇到不可預(yù)測的障礙的似然性、以及在用于如何搜索給定群集質(zhì)點(diǎn)的決策功能中所使用的隨機(jī)性的數(shù)量的函數(shù)。圖3和4示出了組織給定群集的搜索的一種可能的方式。
圖3是根據(jù)本說明的每個(gè)機(jī)器人所執(zhí)行的移動(dòng)控制的說明性方法的流程圖。移動(dòng)控制回路不斷地檢查狀態(tài),并確保機(jī)器人在正確方向上移動(dòng)。如圖3所示,在步驟52,系統(tǒng)檢查計(jì)時(shí)器,來確定是否到了質(zhì)點(diǎn)的再群集的時(shí)間。再群集計(jì)時(shí)可以用真實(shí)的計(jì)時(shí)器實(shí)現(xiàn),或是在質(zhì)點(diǎn)上的某些度量的結(jié)果來實(shí)現(xiàn),例如動(dòng)態(tài)負(fù)載平衡算法。如果到了再群集的時(shí)間,那么在步驟54,質(zhì)點(diǎn)被再群集,并且在步驟56,路點(diǎn)(waypoint)被設(shè)置在該群集的質(zhì)心。任務(wù)分配是通過將該群集劃分為K個(gè)不同的子組(subset),一組給K個(gè)機(jī)器人中的一個(gè)來進(jìn)行搜索而實(shí)現(xiàn)的。實(shí)現(xiàn)此目的的一種方式是通過例如K均值的集群算法。
在步驟52,如果機(jī)器人確定沒有到進(jìn)行再群集的時(shí)間,則在步驟56,方法50運(yùn)行移動(dòng)控制回路。在步驟58,移動(dòng)控制回路檢查機(jī)器人是否已經(jīng)到達(dá)或通過了路點(diǎn)。如果是,那么在步驟60,回路選擇下一個(gè)路點(diǎn),然后在步驟62和64按照到達(dá)那里的需要來調(diào)整前進(jìn)方向(heading)。如果在步驟58機(jī)器人還沒有到達(dá)路點(diǎn),那么回路前進(jìn)到步驟62,在此機(jī)器人檢查其當(dāng)前前進(jìn)方向是否會將其帶到該路點(diǎn)。如果前進(jìn)方向正確,回路返回到再群集步驟的時(shí)間(步驟52)。否則,在步驟64,在返回到步驟52之前更新前進(jìn)方向。
該行為可以與已經(jīng)輸入到的飛行器傳動(dòng)裝置的最終控制信號其它行為或功能并行進(jìn)行,例如障礙物回避。
在步驟60選擇路點(diǎn)的步驟可以通過依據(jù)重要性(權(quán)重)、距離、和其它因素對在當(dāng)前群集中質(zhì)點(diǎn)進(jìn)行排序,并選擇最佳質(zhì)點(diǎn)前往來實(shí)現(xiàn)。其它因素可以包括機(jī)器人的機(jī)動(dòng)性考慮,例如前進(jìn)到質(zhì)點(diǎn)所需的最大轉(zhuǎn)彎半徑。
對質(zhì)點(diǎn)進(jìn)行群集的步驟(步驟54)包括采用以下方式將質(zhì)點(diǎn)劃分成K個(gè)唯一的子組即所有機(jī)器人都清楚哪個(gè)機(jī)器人應(yīng)搜索哪個(gè)子組或群集。在下面標(biāo)題為質(zhì)點(diǎn)群集的部分中詳細(xì)說明了一種此類方法。
在一些例子中,機(jī)器人的選定群集可以是小片狀(patchy)的,這些片可以被廣闊的區(qū)域分離。在下面圖4中所示的L2群集會揭示這些子片(sub-patch)。對每個(gè)子片依次進(jìn)行搜索。對于每個(gè)子片,機(jī)器人每次選擇質(zhì)點(diǎn)之一而前往,隨著其前進(jìn)而清除質(zhì)點(diǎn)(圖2的每個(gè)步驟36),直到質(zhì)點(diǎn)的密度減小到足以使其它子片變得更為迫切。
圖4是根據(jù)本說明的移動(dòng)控制方法的可替換實(shí)施。在圖4的實(shí)施70中,系統(tǒng)在第一群集L1中執(zhí)行質(zhì)點(diǎn)的第二次群集。在第一群集L1中的每個(gè)子群集L2在移動(dòng)到下一個(gè)子群集之前被搜索。因此,除用于L2群集的額外步驟之外,圖4與圖3相似。
如在圖4中所示,在完成在組員之間劃分整個(gè)搜索空間的第1層群集(L1)之后,每個(gè)組員將進(jìn)行第2層群集(L2)。L2在成員的L1群集中找到子群集。進(jìn)行L2群集的一種方式是使用K均值算法,其中K等于某個(gè)小的任意值,其大到足以找到密集的子群集。在下面稱為“質(zhì)點(diǎn)群集”的部分中對“K均值”進(jìn)行了說明。K的數(shù)值完全依賴于域的需要。在不會脫離本說明的范圍的情況下,更智能的群集算法可以是參數(shù)化的,以不依賴于域的方式找到群集的正確大小。
因此,在圖4中,如果在步驟72確定是進(jìn)行L1再群集的時(shí)間,那么在步驟74執(zhí)行L1 K均值。如在上述的步驟52,再群集計(jì)時(shí)可以用真實(shí)的計(jì)時(shí)器或在質(zhì)點(diǎn)上的一些度量的結(jié)果來實(shí)施,例如動(dòng)態(tài)平衡算法。接下來,如在上述步驟56中,在步驟76將路點(diǎn)設(shè)定為等于L1群集的質(zhì)心。在步驟78,機(jī)器人確定其是否已經(jīng)到達(dá)或通過了當(dāng)前路點(diǎn)。如果沒有,則在步驟92,其進(jìn)行檢查以確定該機(jī)器人是在前往該路點(diǎn)。如果前進(jìn)方向是正確的,其返回到步驟72。如果不是,其返回步驟72之前,在步驟94更新前進(jìn)方向。
如果在步驟78確定已經(jīng)到達(dá)當(dāng)前路點(diǎn),則方法70在步驟80檢查L1質(zhì)點(diǎn)的L2群集是否已經(jīng)完成。如果沒有,在步驟84執(zhí)行L2群集,步驟86將路點(diǎn)設(shè)定為所選擇的L2子群集的質(zhì)心。無論選擇哪個(gè)子群集是沒有關(guān)系的,或者選擇可以是基于諸如在該子群集中的質(zhì)點(diǎn)的優(yōu)先級或數(shù)量等因素而做出的。一旦選擇了路點(diǎn),該方法就移動(dòng)到步驟92,按如上所述檢查前進(jìn)方向。如果步驟80確定L2子群集已經(jīng)產(chǎn)生,那么步驟82測試是否到了從機(jī)器人正在搜索的L2子群集移動(dòng)到另一個(gè)的時(shí)間。
可以有許多標(biāo)準(zhǔn)用于該決策。在任何情況下,系統(tǒng)應(yīng)全面搜索每個(gè)區(qū)域,而不會忽略其它區(qū)域。如果步驟82判定到了移動(dòng)的時(shí)間,在步驟88選擇一個(gè)新的子群集,在步驟86設(shè)定路點(diǎn),然后在步驟92檢查前進(jìn)方向。否則,機(jī)器人會通過在該子群集中選擇一個(gè)新的路點(diǎn)來繼續(xù)搜索同一L2子群集,與在圖3的步驟60中所述的方式相同。
在最佳模式中,選擇子片的決策是在該片中質(zhì)點(diǎn)類型的優(yōu)先級、在該片中質(zhì)點(diǎn)數(shù)量、和該片的密度的函數(shù)。完成此目的的一種簡單方式是通過對在每片中的質(zhì)點(diǎn)的總和,依據(jù)其優(yōu)先級進(jìn)行加權(quán),并以邊界圓的區(qū)域來劃分。選擇首先前往的質(zhì)點(diǎn)的一種方法是對該子片中的質(zhì)點(diǎn),依據(jù)其優(yōu)先級等級和其與機(jī)器人的距離進(jìn)行排序,并前往在該列表上的第一個(gè)。該方案導(dǎo)致了不確定的路線,其對于對手來說是更加不可預(yù)測的,但比起其它方案來說,會需要更高的機(jī)動(dòng)能力且能效較低。在不會脫離本說明的范圍的情況下,可以預(yù)見到用于特定應(yīng)用的更智能的方案,計(jì)算最大限度清除最高優(yōu)先級質(zhì)點(diǎn)的軌跡(trajectory)。
至于何時(shí)放棄一個(gè)子片并前往另一個(gè)的決定是再次基于在前面段落中所述的子片決策函數(shù)的,但為了避免情況逆轉(zhuǎn)(flip-flop),合理的是繼續(xù)搜索當(dāng)前子片,直到其決策函數(shù)值(例如,上述加權(quán)的總和)比下一個(gè)最佳片的值低某個(gè)閾值。
隨著時(shí)間的過去,為模擬每個(gè)對象的移動(dòng)而產(chǎn)生的質(zhì)點(diǎn)分布由行為模型來移動(dòng)。它們的移動(dòng)具有一些隨機(jī)性,并隨著它們的移動(dòng)而散開,以反映不斷增加的與位置有關(guān)的不確定性。
圖1示出了當(dāng)接收到與這些對象中的一個(gè)有關(guān)的信息時(shí),該對象的分布會在某種程度上進(jìn)行收縮,降低其離散度,以反映對于該對象的位置的更高的可信度。消息還可以排除對象所屬的一個(gè)或多個(gè)分類。這發(fā)生在另一搜索平臺發(fā)現(xiàn)該物體并對其進(jìn)行識別的時(shí)候。當(dāng)機(jī)器人搜索由表示某些假設(shè)的群集所覆蓋的區(qū)域,并且沒有發(fā)現(xiàn)任何東西時(shí),就會不太可信,因?yàn)樵搶ο罂赡芤呀?jīng)躲避了偵察。在此情況下,那些假設(shè)會被縮減但不會被排除。
操作圖像的一致性根據(jù)本說明,當(dāng)告知每個(gè)機(jī)器人一個(gè)對象的位置時(shí),機(jī)器人組成其自己的質(zhì)點(diǎn)分布。在產(chǎn)生偽高斯分布時(shí),再次包含了隨機(jī)因素。隨著每個(gè)機(jī)器人的移動(dòng),在其傳感器掃描下,其清除具有某些概率的質(zhì)點(diǎn)。同樣,每一個(gè)機(jī)器人都模擬其隊(duì)友的移動(dòng)(例如,對最后報(bào)告的位置、速度、和前進(jìn)方向的直接擴(kuò)展),并清除其自身存儲器內(nèi)的位于隊(duì)友的傳感器掃描之下的質(zhì)點(diǎn)。在每個(gè)機(jī)器人的存儲器中,在與同一對象有關(guān)的同一假設(shè)的質(zhì)點(diǎn)分布之間可以有一些變化。這意謂著每個(gè)機(jī)器人可以稍微不同地進(jìn)行群集,并在稍有不同的時(shí)間決定進(jìn)行再群集,即使它們運(yùn)行同樣的決策度量。
可控制的參數(shù)是在機(jī)器人狀態(tài)報(bào)告之間的時(shí)間、在這些狀態(tài)報(bào)告中共享的信息量、以及質(zhì)點(diǎn)放置、移動(dòng)和移去的概率和隨機(jī)性。對于每個(gè)區(qū)域,參數(shù)會稍微不同,需要實(shí)驗(yàn)來確定最佳參數(shù)。
搜索效率有效地搜索一個(gè)區(qū)域以搜尋移動(dòng)對象所需的飛行器數(shù)量是搜索區(qū)域的地理范圍、搜索機(jī)器人的速度和被搜尋對象的最大可能移動(dòng)速度、以及搜索機(jī)器人在其傳感器范圍內(nèi)探測到一個(gè)對象的可能性的函數(shù)。
體系結(jié)構(gòu)圖5示出了適于執(zhí)行本發(fā)明的說明的說明性的機(jī)器人控制體系結(jié)構(gòu)的框圖。在圖5中,矩形框表示硬件,圓形或橢圓形框表示軟件程序。每個(gè)機(jī)器人都具有系統(tǒng)100和機(jī)載傳感器104,系統(tǒng)100包括無線電收發(fā)機(jī)102,機(jī)載傳感器104包括作為實(shí)例的激光雷達(dá)(LADAR)105、紅外線設(shè)備(IR)106和照相機(jī)107。另外,系統(tǒng)100包括信號和數(shù)據(jù)處理器110(以虛線示出),連同全球定位傳感器108、移動(dòng)控制子系統(tǒng)112和移動(dòng)傳動(dòng)裝置122。
無線電設(shè)備102從其它機(jī)器人和/或中央控制站接收消息,并將該消息傳遞到處理器110,用于在消息處理軟件程序10中進(jìn)行處理。在上面相對于圖1對消息處理軟件10進(jìn)行了說明。從機(jī)載傳感器104而來的數(shù)據(jù)被圖2的傳感器處理程序30所處理。通過根據(jù)組模型44或敵人模型46而作用于質(zhì)點(diǎn)存儲器48,來并行地移動(dòng)和感測。
組模型和敵人模型被預(yù)先載入機(jī)器人,可以是也可以不是由經(jīng)驗(yàn)獲知的。敵人模型是按照需要產(chǎn)生、保存和移動(dòng)概率分布,以適當(dāng)?shù)谋硎緩挠脩艉推渌阉麝?duì)友而來的輸入報(bào)告的行為模型。其模擬所關(guān)注對象的移動(dòng)。組模型是參與到共同搜索中的其它飛行器的單獨(dú)的行為模型,其是通過從其它隊(duì)友而來的位置報(bào)告而進(jìn)行更新的。組模型估計(jì)隊(duì)友的移動(dòng),并移動(dòng)質(zhì)點(diǎn)以表示由其它隊(duì)友所搜索的區(qū)域。這些分布傳送到搜索區(qū)域選擇器50,其執(zhí)行如上相對于圖3和4所述的,L1和L2群集的群集和選擇。L1群集的選擇依賴于與每個(gè)隊(duì)友所在位置有關(guān)的組模型信息。
一旦選擇了一個(gè)群集來進(jìn)行搜索,選擇路點(diǎn)函數(shù)70就在該群集內(nèi)選擇目的地。在此情況下,我們將該選擇與其它所關(guān)注內(nèi)容相融合,如在行為裁定單元112中回避障礙物等等。該決策由移動(dòng)判別器120做出,其可以采用所引用的David Payton的發(fā)明來實(shí)現(xiàn)。速度和轉(zhuǎn)動(dòng)速率命令由移動(dòng)判別器120輸出,并被移動(dòng)轉(zhuǎn)動(dòng)裝置122使用,以控制機(jī)器人移動(dòng)的方向和速度。
操作“電子智能”數(shù)據(jù)(ELINT)是從該區(qū)域中人們而來的觀測報(bào)告、智能分析理論、以及從衛(wèi)星、飛行器和其它來源而來的傳感器數(shù)據(jù)的融合。ELINT的更新表示不確定的信息;即使某物看起來舉止可疑,但必須得到進(jìn)一步證實(shí)其是否是敵人的坦克、民用車輛、校車等等。根據(jù)本說明,當(dāng)接收到此類消息時(shí),每個(gè)機(jī)器人或UAV將其以表示每個(gè)假設(shè)的質(zhì)點(diǎn)群集的形式記錄在稱為位置地圖的本地動(dòng)態(tài)數(shù)據(jù)結(jié)構(gòu)中。質(zhì)點(diǎn)的不同分類表示與對象身份有關(guān)的不同理論,并與威脅等級或優(yōu)先級相關(guān)聯(lián)。
在ELINT的更新之間,每個(gè)UAV使用用于執(zhí)行此類實(shí)體的行為模型的簡單多假設(shè)質(zhì)點(diǎn)濾波器來移動(dòng)質(zhì)點(diǎn)。例如,表示校車的質(zhì)點(diǎn)可以移向?qū)W校地帶,那些表示敵人坦克的質(zhì)點(diǎn)會被引向潛在的目標(biāo),例如可疑的油庫或電廠。這在下面的圖6中被示出。
圖6是根據(jù)本說明的在ELINT更新幾分鐘后的模擬情況。在右上角的UAV得到與可能的目標(biāo)連同其身份的似然性(轎車、坦克、或大客車)有關(guān)的ELINT(電子智能)報(bào)告。每個(gè)UAV在其質(zhì)點(diǎn)存儲器中產(chǎn)生概率質(zhì)點(diǎn)來表示該目標(biāo)。精確的質(zhì)點(diǎn)位置在每個(gè)UAV上是不同的,但分布在統(tǒng)計(jì)上是相等的。在該圖中,城鎮(zhèn)東南的高速公路和幾個(gè)確定的建筑物是行為模型的吸引物。盡管質(zhì)點(diǎn)分布與其它UAV的本地質(zhì)點(diǎn)存儲器在統(tǒng)計(jì)上相等,但各個(gè)質(zhì)點(diǎn)的位置并不相同。
圖7是根據(jù)本說明的在ELINT更新十分鐘后的模擬情況。每個(gè)假設(shè)的概率質(zhì)點(diǎn)分布由適當(dāng)?shù)男袨槟P酮?dú)立地進(jìn)行移動(dòng)。應(yīng)注意到為了使質(zhì)點(diǎn)達(dá)到這樣的散布,在一段時(shí)間內(nèi)將沒有對對象位置的更新。
圖8是對圖6和7中所示情況的計(jì)算機(jī)仿真的屏幕截圖。使用了稱為參與者平臺(PlayerStage)(Gerkey等人2003)的公共域仿真。根據(jù)本說明配置一組UAV,其每一個(gè)都具有實(shí)際的覆蓋區(qū)、GPS、多通道無線電設(shè)備、和使用置信檢測的簡單對象識別。在該說明性的實(shí)施例中,UAV控制系統(tǒng)在3個(gè)行為之間執(zhí)行裁定前往點(diǎn),回避障礙物,和持續(xù)轉(zhuǎn)向。裁定的結(jié)果是給移動(dòng)傳動(dòng)裝置的速度和轉(zhuǎn)動(dòng)速率命令(Payton等人1990),所述移動(dòng)傳動(dòng)裝置遵循相當(dāng)真實(shí)的約束。在參與者平臺中,每個(gè)代理都具有其自己的專用存儲器,任何要共享的信息都必須在消息中明確的發(fā)送。
在圖8右側(cè)的三個(gè)黑窗口表示每個(gè)UAV的位置地圖。應(yīng)注意到,在這些地圖中的質(zhì)點(diǎn)分布并不相同。在左上象限中的UAV(UAV具有傳感器扇形)被在其位置地圖中的質(zhì)點(diǎn)群集吸引到該區(qū)域,并探測到一個(gè)坦克。在右下象限中的UAV正好識別出一輛校車,并消除其位置地圖中它的質(zhì)點(diǎn)(頂上的一個(gè))。其它兩個(gè)UAV還沒有從它們的地圖中刪除表示該車輛的質(zhì)點(diǎn)。在右下的UAV現(xiàn)在正在沿著道路前往左下象限,在此處剛剛出現(xiàn)了一組質(zhì)點(diǎn),其表示剛由ELINT報(bào)告的坦克。
需要進(jìn)行通信以接收對于目標(biāo)和隊(duì)友的位置的周期性ELINT更新。但在這些區(qū)域中的通信是不可靠的,并受制于干擾、天線未對準(zhǔn)(在機(jī)動(dòng)期間)、以及大氣的影響。解決該問題的本發(fā)明的方法是使每個(gè)UAV在通信事件之間,概率性地模擬組員和目標(biāo)的移動(dòng)。這使得搜索性能在通信信號丟失期間適度地降低。
如上所述,當(dāng)飛行器搜索時(shí),其根據(jù)探測概率,從在其傳感器覆蓋區(qū)下的區(qū)域中的其位置地圖中移去質(zhì)點(diǎn)。在超時(shí)之后,那些質(zhì)點(diǎn)會回到地圖中。由于每個(gè)UAV具有略微不同的組,質(zhì)點(diǎn)的清除沒有在隊(duì)友之間傳送。作為替代,每個(gè)UAV使用隊(duì)友移動(dòng)的模型在其自己的地圖中清除質(zhì)點(diǎn)。當(dāng)接收到報(bào)告隊(duì)友位置的消息時(shí),如果其位置與依據(jù)該模型而預(yù)測的顯著不同,則可以更正質(zhì)點(diǎn)地圖。如果對象被發(fā)現(xiàn),則證實(shí)其身份并且消除所有表示不正確假設(shè)的質(zhì)點(diǎn)。對象信息被傳送到其它飛行器,它們對其自己的專用位置地圖做出相類似的改變。
為保持靜態(tài)地理區(qū)域處于監(jiān)視之下,可以使用特定類的靜態(tài)質(zhì)點(diǎn)。此類質(zhì)點(diǎn)不移動(dòng),并總是在超時(shí)過后返回。通過調(diào)整該質(zhì)點(diǎn)返回的速度,可以對多長時(shí)間搜索一次一個(gè)區(qū)域進(jìn)行統(tǒng)計(jì)控制。
質(zhì)點(diǎn)群集每個(gè)UAV都被吸引到質(zhì)點(diǎn)密集的區(qū)域。這驅(qū)動(dòng)了搜索行為。為避免必須與隊(duì)友對特定搜索區(qū)域或任務(wù)分配進(jìn)行協(xié)商,每個(gè)UAV用同一群集算法來劃分質(zhì)點(diǎn),并選擇最接近的。這實(shí)施了簡單的分散任務(wù)分配技術(shù)。UAV通過模擬彼此的行為來協(xié)調(diào)它們的搜索,通過不經(jīng)常的(每隔幾秒鐘)與它們位置有關(guān)的消息來更新所述行為。
K均值算法(Lloyd 1982)用于對敵人概率質(zhì)點(diǎn)進(jìn)行群集。簡要而言,如果概率質(zhì)點(diǎn)以矢量{p1,...pn},pi∈IR2來表示,那么目的是找到K個(gè)群集,每一個(gè)都由矢量mk∈IR2,k={1...K}來表示,并且數(shù)據(jù)的分配是針對群集的,從而形成“緊湊的”群集。我們選擇K作為UAV的數(shù)量;每個(gè)UAVi獲得平均值與其當(dāng)前位置最接近的群集。群集最小化了目標(biāo)函數(shù)H 在此,c將質(zhì)點(diǎn)pi映射到位于mc(i)的群集上,H是對于通過映射c而表示每個(gè)質(zhì)點(diǎn)的失真的測量。該算法通過將mc(i)設(shè)定為UAVi的位置來進(jìn)行初始化。在每次重復(fù)時(shí),將每個(gè)概率質(zhì)點(diǎn)pi分配給最接近的群集位置mc(i),然后將每個(gè)mc(i)移動(dòng)到其被分配的質(zhì)點(diǎn)的質(zhì)心,降低失真H,直到在某點(diǎn)不再有進(jìn)一步提高為止;映射c停止變化。由于每個(gè)UAVi被映射到唯一的mc(i),這導(dǎo)致了對UAV進(jìn)行唯一的質(zhì)點(diǎn)分配。
在不脫離本說明的范圍的情況下,可以使用其它的群集技術(shù)。標(biāo)準(zhǔn)的K均值算法不能保證每個(gè)平均值都具有分配給它的確定數(shù)量的點(diǎn)-一個(gè)群集可以以沒有包含點(diǎn)而結(jié)束。此外,對于考慮諸如給予特定類型質(zhì)點(diǎn)的優(yōu)先級或緊迫性權(quán)重之類的參數(shù)(即pi∈IRd,d>2)而言,其也是有用的。
群集內(nèi)搜索根據(jù)本說明,當(dāng)UAV到達(dá)其自己分配的群集的質(zhì)心時(shí),它在該群集內(nèi)選擇要移動(dòng)前往的概率質(zhì)點(diǎn)。這與前往最近的質(zhì)點(diǎn)一樣簡單,但我們還要根據(jù)機(jī)動(dòng)能力的約束,考慮質(zhì)點(diǎn)優(yōu)先級或緊迫性。因此UAV應(yīng)在檢查大客車假設(shè)之前,先檢查完坦克假設(shè)質(zhì)點(diǎn)。這是通過依據(jù)優(yōu)先級、距離、和偏離當(dāng)前速度矢量的偏航角來對在群集中的質(zhì)點(diǎn)進(jìn)行排序而實(shí)現(xiàn)的。較高優(yōu)先級、較近距離、和所必需的較小的偏航角是最佳的。為增加一些更多的隨機(jī)性,下一個(gè)路點(diǎn)可以是前20%的最佳質(zhì)點(diǎn)的隨機(jī)選擇。
在對抗搜索中,希望避免運(yùn)行會被敵人所采用的預(yù)測搜索模式。上述過程導(dǎo)致了極為不可預(yù)測的移動(dòng)。當(dāng)然,在可預(yù)測性與效率之間存在折衷,在許多方式中,搜索模式越不可預(yù)測,能效就越低。該折衷能通過在上述“下一個(gè)質(zhì)點(diǎn)”排序中調(diào)整在偏航標(biāo)準(zhǔn)上的權(quán)重,和/或改變在隨機(jī)選擇中的質(zhì)點(diǎn)數(shù)量來進(jìn)行控制。
此情況是動(dòng)態(tài)的。新的對象被報(bào)告,老的對象被識別并且有時(shí)被作為目標(biāo)。所有數(shù)據(jù)都合并成具有優(yōu)先級的質(zhì)點(diǎn)的公共操作圖像,所以做出搜索決策所需的推理是相當(dāng)簡單的,并服從基于行為的方法。
在不經(jīng)常進(jìn)行信息更新的基礎(chǔ)上,質(zhì)點(diǎn)分布被每個(gè)UAV獨(dú)立的產(chǎn)生、移動(dòng)和清除。當(dāng)?shù)搅嗽偃杭臅r(shí)間時(shí),在被每個(gè)UAV所保存的位置圖像之間的差異會導(dǎo)致稍微不同的群集位置(mc(i)),其會導(dǎo)致意外的行為。再群集的決策可以基于與在搜索所處理的質(zhì)點(diǎn)分布中的變化有關(guān)的度量。另一種方法是使用變化得更慢的群集技術(shù),或者是在再群集之前需要更多的協(xié)調(diào)。
信息一致發(fā)布當(dāng)ELINT消息通告一個(gè)新目標(biāo)時(shí),每個(gè)UAV基于該消息的信息組成其自己的質(zhì)點(diǎn)偽隨機(jī)分布。隨后的ELINT消息可能會也可能不會更新該目標(biāo)的位置和/或身份。隨著每個(gè)UAV的移動(dòng),其清除在其傳感器覆蓋區(qū)下的具有某種概率的質(zhì)點(diǎn)。同樣地,其模擬隊(duì)友的移動(dòng)-當(dāng)前地從最后報(bào)告的位置、速度、和前進(jìn)方向進(jìn)行的簡單線性插值-并清除在每個(gè)隊(duì)友傳感器掃描之下的質(zhì)點(diǎn)。
在圖8中的右側(cè),每一個(gè)窗口對應(yīng)三個(gè)UAV中的一個(gè),示出了在其位置地圖上的質(zhì)點(diǎn)位置。在這三者之間的比較示出了在每個(gè)隊(duì)友所模擬的質(zhì)點(diǎn)分布之間的較小的隨機(jī)變化。這意謂著當(dāng)飛行器確定進(jìn)行再群集時(shí),它們的群集會在某種程度上改變。
通常,在UAV之間的群集中的差異是較小的,系統(tǒng)產(chǎn)生良好的性能。即使是每隔幾分鐘目標(biāo)主要突然出現(xiàn)在地圖上三個(gè)位置區(qū)域中,并主要在公路上行駛的事實(shí)也是如此。盡管這通常意謂著目標(biāo)彼此靠近,但可由UAV每隔5秒鐘發(fā)送僅包括位置和速度的情況報(bào)告來獲得較好的結(jié)果。偶爾差異會變得相當(dāng)大,從而產(chǎn)生顯得無結(jié)果的搜索模式。在位置一致性的標(biāo)題下的一些因素會促成這個(gè)問題??煽刂频膮?shù)是在UAV狀態(tài)報(bào)告之間的時(shí)間、在那些狀態(tài)報(bào)告中共享的信息量、以及質(zhì)點(diǎn)被放置、移動(dòng)和移去的概率和隨機(jī)性。參數(shù)值的最佳選擇應(yīng)依據(jù)目標(biāo)彼此間有多近。目標(biāo)越近,UAV就越近,每個(gè)UAV的位置圖像就必須更加適當(dāng)?shù)夭幌嗷サ钟|。
另一個(gè)UAV行為的準(zhǔn)確預(yù)測需要另一飛行器用以做出其決策的每個(gè)變量值的準(zhǔn)確認(rèn)知。優(yōu)選的是避免對所要求的這種高帶寬可靠通信的依賴性。較好的解決方法是對于每個(gè)UAV,更頻繁的傳送其當(dāng)前位置和速度。在大多數(shù)情況下,當(dāng)經(jīng)常進(jìn)行對象的ELINT更新時(shí),能夠調(diào)整UAV的報(bào)告速度,以實(shí)現(xiàn)在每個(gè)UAV位置圖像之間的非常好的一致性。但如果ELINT更新被干擾或正好沒有所關(guān)注對象的新信息,UAV就需要協(xié)調(diào)它們的再群集。根據(jù)本說明,再群集操作被周期性的通告,在那時(shí)每個(gè)UAV通告其通過位置的簡短歷史記錄。這會是比不斷保持一致的質(zhì)點(diǎn)地圖所需的消息短得多和不頻繁得多的消息。每個(gè)UAV隨后會修改其位置地圖并進(jìn)行再群集。這會導(dǎo)致非常相似的任務(wù)分配。在最壞情況下,可以在再群集之后增加證實(shí)步驟,以確保每個(gè)UAV計(jì)算得出的群集中心合理地相類似。
總之,在協(xié)調(diào)性變得不一致時(shí),通信帶寬能夠增加??梢曰诒镜匦畔眍A(yù)測這些時(shí)間,所述本地信息包括在UAV之間的距離和接收到位置更新時(shí)的速度。
本發(fā)明的終端用戶會體驗(yàn)更集中和目標(biāo)性更強(qiáng)的搜索。當(dāng)前使用的系統(tǒng)性的或其它強(qiáng)力搜索機(jī)制(例如將區(qū)域按地理劃分并運(yùn)行搜索模式)必須依賴速度和/或所增加的資源,以增大成功的概率。本發(fā)明提高了發(fā)現(xiàn)目標(biāo)對象的概率,并且既不升級搜索平臺的物理容量,又不增加平臺的數(shù)量。其通過為搜索平臺提供一種用于在時(shí)域內(nèi)縮小搜索區(qū)域的機(jī)制來實(shí)現(xiàn)此被增加值在概率上的增大。盡管不是必需的,通過對概率群集進(jìn)行再分組以更接近地表示新信息,基于位置信息的更新時(shí)間進(jìn)一步減小了該搜索區(qū)域,并使搜索更加集中。
本發(fā)明對于復(fù)雜的和動(dòng)態(tài)變化的情況尤其有用,報(bào)告按照時(shí)間周期輸入,并且每個(gè)報(bào)告都具有前述對象的更新信息或新對象的消息,每個(gè)對象都具有與它們身份有關(guān)的幾個(gè)假設(shè)。本發(fā)明的方法使用了非常簡單直接的方法來將這些報(bào)告融合成公共操作圖像。通過使用放置于地圖上的概率質(zhì)點(diǎn)的總體,將對象的位置和可能的身份轉(zhuǎn)換為公共表示,其驅(qū)動(dòng)搜索。本發(fā)明減輕了對復(fù)雜融合引擎和任務(wù)管理的需要;融合通過概率的自然重疊來實(shí)現(xiàn)。因此,通過增大成功搜索的概率而又不增加任務(wù)成本,此功能會給終端用戶帶來價(jià)值。
本發(fā)明還提供了由許多獨(dú)立用戶引導(dǎo)的分布式搜索組的可能性。例如,如果6個(gè)UAV正在飛過一個(gè)軍事戰(zhàn)役地帶,整個(gè)戰(zhàn)場的指揮官會提供可疑的敵人行為的報(bào)告。UAV會成為總體支持資源,一旦敵人被報(bào)告,其就自動(dòng)組織以搜索敵人。該組織可以是自動(dòng)的-無需中央控制設(shè)備,所述中央控制設(shè)備由操作員填充要求并決定最好如何使用它們。服務(wù)可以是在優(yōu)先級基礎(chǔ)上的-例如攻擊的主攻(maineffort)會具有比支援單元更高的優(yōu)先級,這會反映在由每個(gè)單元的要求所導(dǎo)致的,放置在地圖上的質(zhì)點(diǎn)的優(yōu)先級中。
最協(xié)作的控制技術(shù)要求在機(jī)器人之間頻繁的和可靠的通信。作為替代的,本發(fā)明通過在更新之間依靠模擬其它隊(duì)友的行為,來減輕這種依賴性。這提供了搜索效率的適度降低。
搜索任務(wù)的自動(dòng)劃分為用戶提供對多個(gè)機(jī)器人的間接高級控制。用戶通過指定在要搜索區(qū)域上的概率分布,以直觀的方式直接表達(dá)搜索任務(wù)。這是在當(dāng)前系統(tǒng)上的進(jìn)步,在當(dāng)前系統(tǒng)中,用戶必須明確指定一組機(jī)器人,并分配給它們?nèi)蝿?wù)。然而,用戶能以很高的準(zhǔn)確性來指定哪個(gè)區(qū)域要被搜索及具有何種優(yōu)先級。通過使用行為模型實(shí)際地移動(dòng)表示移動(dòng)目標(biāo)的質(zhì)點(diǎn),本發(fā)明將此帶到了另一個(gè)層面。
可以包括多個(gè)模型,每一個(gè)針對目標(biāo)的一個(gè)假設(shè)身份。模型以多種數(shù)據(jù)來更新,所述數(shù)據(jù)例如包括位置、身份、其它搜索器當(dāng)前的關(guān)注焦點(diǎn)、其它搜索器以前的關(guān)注焦點(diǎn)、其它搜索器的速度、其它搜索器將來的移動(dòng)和成功。搜索可以在物理三維(3D)空間、虛擬數(shù)據(jù)結(jié)構(gòu)或其它應(yīng)用中執(zhí)行。
這樣,在此已經(jīng)參考用于具體應(yīng)用的具體實(shí)施例,對本發(fā)明進(jìn)行了描述。獲知了本說明的本領(lǐng)域技術(shù)人員會認(rèn)識到,其他改進(jìn)應(yīng)用和實(shí)施例也在其范圍內(nèi)。
因此,所附的權(quán)利要求意欲覆蓋在本發(fā)明范圍內(nèi)的任何及所有此類應(yīng)用、改進(jìn)和實(shí)施例。
權(quán)利要求
1.一種搜索系統(tǒng),包括第一裝置,用于探測所關(guān)注的對象;第二裝置,用于預(yù)測所述對象的行為;以及第三裝置,用于響應(yīng)于用于預(yù)測行為的所述裝置,將所述第一裝置指引到所述對象。
2.如權(quán)利要求1所述的發(fā)明,其中,所述第一,第二和第三裝置布置在移動(dòng)平臺內(nèi)。
3.如權(quán)利要求2所述的發(fā)明,其中,所述移動(dòng)平臺是機(jī)器人。
4.如權(quán)利要求3所述的發(fā)明,其中,所述移動(dòng)平臺是無人駕駛飛行器。
5.如權(quán)利要求1所述的發(fā)明,其中,用于預(yù)測行為的所述裝置包括預(yù)測模型。
6.如權(quán)利要求5所述的發(fā)明,其中,所述模型包括采用一組質(zhì)點(diǎn)形式的概率分布。
7.如權(quán)利要求6所述的發(fā)明,其中,所述第二裝置包括用于移動(dòng)所述質(zhì)點(diǎn)以反映所述對象的行為的裝置。
8.如權(quán)利要求7所述的發(fā)明,其中,所述第二裝置包括多個(gè)模型,每一個(gè)都針對所述對象的一個(gè)假設(shè)身份。
9.如權(quán)利要求8所述的發(fā)明,還包括,用于接收對于所述對象位置的更新的裝置。
10.如權(quán)利要求9所述的發(fā)明,還包括,用于接收對于所述對象身份的更新的裝置。
11.如權(quán)利要求10所述的發(fā)明,其中,所述更新包含與所述對象有關(guān)的概率信息。
12.如權(quán)利要求11所述的發(fā)明,其中,所述更新的頻率或有效性是不確定的。
13.如權(quán)利要求6所述的發(fā)明,其中,所述第一裝置被指引在搜索區(qū)域內(nèi)。
14.如權(quán)利要求13所述的發(fā)明,其中,所述第一,第二和第三裝置布置在移動(dòng)平臺內(nèi)。
15.如權(quán)利要求14所述的發(fā)明,其中,所述平臺是機(jī)器人。
16.如權(quán)利要求15所述的發(fā)明,其中,所述系統(tǒng)包括多個(gè)機(jī)器人。
17.如權(quán)利要求16所述的發(fā)明,其中,所述模型適于指引每個(gè)機(jī)器人搜索所述搜索空間的一個(gè)唯一的區(qū)域。
18.如權(quán)利要求17所述的發(fā)明,其中,所述模型適于使用質(zhì)點(diǎn)形式的概率分布,來指引每個(gè)機(jī)器人搜索所述搜索空間的一個(gè)唯一的區(qū)域。
19.如權(quán)利要求18所述的發(fā)明,其中,所述模型適于使用將所述質(zhì)點(diǎn)劃分為每個(gè)搜索器一個(gè)組的群集技術(shù),來指引每個(gè)機(jī)器人搜索所述搜索空間的一個(gè)唯一的區(qū)域。
20.如權(quán)利要求18所述的發(fā)明,其中,所述模型適于以唯一的方式將機(jī)器人分配給質(zhì)點(diǎn)組。
21.如權(quán)利要求18所述的發(fā)明,其中,所述模型適于以由每個(gè)機(jī)器人使用所述機(jī)器人的預(yù)定特性而計(jì)算得到的方式,將所述機(jī)器人分配給質(zhì)點(diǎn)組。
22.如權(quán)利要求19所述的發(fā)明,其中,所述群集技術(shù)是K均值。
23.如權(quán)利要求19所述的發(fā)明,其中,所述質(zhì)點(diǎn)的所述概率分布是群集。
24.如權(quán)利要求23所述的發(fā)明,其中,每個(gè)所述機(jī)器人都被指引,以搜索由所述模型所選擇的各自的群集。
25.如權(quán)利要求24所述的發(fā)明,其中,每個(gè)機(jī)器人的每個(gè)第三裝置適于將其所述第一裝置指引向所述質(zhì)點(diǎn)概率分布的質(zhì)心。
26.如權(quán)利要求24所述的發(fā)明,其中,所述模型適于將每個(gè)機(jī)器人的探測器指引到在由所述模型所選擇的群集中的質(zhì)點(diǎn)中所選擇的一個(gè)質(zhì)點(diǎn)上。
27.如權(quán)利要求26所述的發(fā)明,其中,每個(gè)機(jī)器人消除表示被其傳感器和其它搜索器的傳感器所觀測的搜索空間的區(qū)域的質(zhì)點(diǎn)。
28.如權(quán)利要求26所述的發(fā)明,其中,每個(gè)被消除的質(zhì)點(diǎn)在一段預(yù)定時(shí)間之后再次出現(xiàn)。
29.如權(quán)利要求26所述的發(fā)明,其中,所述模型適于,隨著每個(gè)機(jī)器人獲得更多與所關(guān)注對象有關(guān)的信息,修改與所關(guān)注的對象有關(guān)的質(zhì)點(diǎn)的分布或密度,以更好地表示新信息。
30.如權(quán)利要求18所述的發(fā)明,包括用于使用所述質(zhì)點(diǎn)跟蹤所述對象的裝置。
31.如權(quán)利要求16所述的發(fā)明,還包括用于接收與其它機(jī)器人有關(guān)的更新的裝置。
32.如權(quán)利要求31所述的發(fā)明,還包括用于在對于其它搜索器的活動(dòng)的更新之間的時(shí)間間隔中,模擬所述其它搜索器的活動(dòng)的裝置。
33.如權(quán)利要求32所述的發(fā)明,其中,所述更新包括與其它搜索器的位置有關(guān)的信息。
34.如權(quán)利要求32所述的發(fā)明,其中,所述更新包括與其它搜索器的當(dāng)前關(guān)注焦點(diǎn)有關(guān)的信息。
35.如權(quán)利要求34所述的發(fā)明,其中,所述當(dāng)前關(guān)注焦點(diǎn)是搜索器的物理傳感器的注意地域。
36.如權(quán)利要求32所述的發(fā)明,其中,所述更新包括與其它搜索器以前的關(guān)注焦點(diǎn)有關(guān)的信息。
37.如權(quán)利要求32所述的發(fā)明,其中,所述更新包括與其它搜索器的速度有關(guān)的信息。
38.如權(quán)利要求32所述的發(fā)明,其中,所述更新包括與其它搜索器未來移動(dòng)有關(guān)的信息。
39.如權(quán)利要求32所述的發(fā)明,其中,所述更新包括與由其它搜索器所確定的對象特性有關(guān)的信息。
40.如權(quán)利要求1所述的發(fā)明,其中,所述行為是在3D物理空間中的移動(dòng)。
41.如權(quán)利要求1所述的發(fā)明,其中,所述行為包括改變可觀測的特性。
42.如權(quán)利要求1所述的發(fā)明,其中,所述行為是在非物理數(shù)據(jù)空間中的移動(dòng)。
43.一種搜索系統(tǒng),包括多個(gè)移動(dòng)平臺;探測器,其安裝在每個(gè)平臺上,用于探測所關(guān)注的對象;以及處理器,其安裝在每個(gè)平臺上,用于預(yù)測所述對象的行為,及用于響應(yīng)于所預(yù)測的行為,將各個(gè)平臺指引到所述對象。
44.如權(quán)利要求43所述的發(fā)明,其中,所述處理器執(zhí)行包括預(yù)測模型的軟件。
45.如權(quán)利要求44所述的發(fā)明,其中,所述模型包括采用一組質(zhì)點(diǎn)形式的概率分布。
46.如權(quán)利要求45所述的發(fā)明,其中,所述模型移動(dòng)所述質(zhì)點(diǎn)以反映所述對象的行為。
47.如權(quán)利要求46所述的發(fā)明,其中,所述模型包括多個(gè)模型,每一個(gè)都針對所述對象的一個(gè)假設(shè)身份。
48.如權(quán)利要求47所述的發(fā)明,其中,所述模型適于接收對于所述對象的位置的更新。
49.如權(quán)利要求48所述的發(fā)明,其中,所述模型適于接收對于所述對象的身份的更新。
50.如權(quán)利要求49所述的發(fā)明,其中,所述更新包含與所述對象有關(guān)的概率信息。
51.如權(quán)利要求50所述的發(fā)明,其中,所述更新的頻率或有效性是不確定的。
52.如權(quán)利要求43所述的發(fā)明,其中,所述探測器被指引在搜索區(qū)域內(nèi)。
53.如權(quán)利要求52所述的發(fā)明,其中,所述平臺是機(jī)器人。
54.如權(quán)利要求53所述的發(fā)明,其中,所述系統(tǒng)包括多個(gè)機(jī)器人。
55.如權(quán)利要求54所述的發(fā)明,其中,所述模型適于指引每個(gè)機(jī)器人搜索所述搜索空間的一個(gè)唯一的區(qū)域。
56.如權(quán)利要求55所述的發(fā)明,其中,所述模型適于使用質(zhì)點(diǎn)形式的概率分布,來指引每個(gè)機(jī)器人搜索所述搜索空間的一個(gè)唯一的區(qū)域。
57.如權(quán)利要求56所述的發(fā)明,其中,所述模型適于使用將所述質(zhì)點(diǎn)劃分為每個(gè)搜索器一組的群集技術(shù),來指引每個(gè)機(jī)器人搜索所述搜索空間的一個(gè)唯一的區(qū)域。
58.如權(quán)利要求57所述的發(fā)明,其中,所述群集技術(shù)是K均值。
59.如權(quán)利要求57所述的發(fā)明,其中,所述模型適于以唯一的方式將機(jī)器人分配給質(zhì)點(diǎn)組。
60.如權(quán)利要求57所述的發(fā)明,其中,所述模型適于以由每個(gè)機(jī)器人采用所述機(jī)器人的預(yù)定特性而計(jì)算得到的方式,將所述機(jī)器人分配給質(zhì)點(diǎn)組。
61.如權(quán)利要求60所述的發(fā)明,其中,所述質(zhì)點(diǎn)的所述概率分布是群集。
62.如權(quán)利要求61所述的發(fā)明,其中,每個(gè)所述機(jī)器人被指引,以搜索由所述模型所選擇的各自的群集。
63.如權(quán)利要求62所述的發(fā)明,其中,每個(gè)機(jī)器人的每個(gè)第三裝置適于將其所述第一裝置指引向所述質(zhì)點(diǎn)概率分布的質(zhì)心。
64.如權(quán)利要求62所述的發(fā)明,其中,所述模型適于將每個(gè)機(jī)器人的探測器指引到在由所述模型所選擇的群集中的質(zhì)點(diǎn)中所選擇的一個(gè)質(zhì)點(diǎn)上。
65.如權(quán)利要求64所述的發(fā)明,其中,每個(gè)機(jī)器人消除表示被其傳感器和其它搜索器的傳感器所觀測的搜索空間區(qū)域的質(zhì)點(diǎn)。
66.如權(quán)利要求64所述的發(fā)明,其中,每個(gè)被消除的質(zhì)點(diǎn)在一段預(yù)定時(shí)間之后再次出現(xiàn)。
67.如權(quán)利要求64所述的發(fā)明,其中,所述模型適于,隨著每個(gè)機(jī)器人獲得更多與所關(guān)注的對象有關(guān)的信息,修改與所關(guān)注的對象有關(guān)的質(zhì)點(diǎn)的分布或密度,以更好地表示新信息。
68.如權(quán)利要求43所述的發(fā)明,包括用于使用所述質(zhì)點(diǎn)跟蹤所述對象的裝置。
69.如權(quán)利要求53所述的發(fā)明,還包括用于接收與其它機(jī)器人有關(guān)的更新的裝置。
70.如權(quán)利要求69所述的發(fā)明,還包括用于在對于其它搜索器的活動(dòng)的更新之間的時(shí)間間隔中,模擬所述其它搜索器的活動(dòng)的裝置。
71.如權(quán)利要求70所述的發(fā)明,其中,所述更新包括與其它搜索器的位置有關(guān)的信息。
72.如權(quán)利要求70所述的發(fā)明,其中,所述更新包括與其它搜索器的當(dāng)前關(guān)注焦點(diǎn)有關(guān)的信息。
73.如權(quán)利要求72所述的發(fā)明,其中,所述當(dāng)前關(guān)注焦點(diǎn)是搜索器的物理傳感器的注意地域。
74.如權(quán)利要求70所述的發(fā)明,其中,所述更新包括與其它搜索器以前的關(guān)注焦點(diǎn)有關(guān)的信息。
75.如權(quán)利要求74所述的發(fā)明,其中,所述更新包括與其它搜索器的速度有關(guān)的信息。
76.如權(quán)利要求75所述的發(fā)明,其中,所述更新包括與其它搜索器未來的移動(dòng)有關(guān)的信息。
77.如權(quán)利要求76所述的發(fā)明,其中,所述更新包括與由其它搜索器所確定的對象特性有關(guān)的信息。
78.如權(quán)利要求43所述的發(fā)明,其中,所述行為是在3D物理空間中的移動(dòng)。
79.如權(quán)利要求43所述的發(fā)明,其中,所述行為包括改變可觀測的特性。
80.如權(quán)利要求43所述的發(fā)明,其中,所述行為是在非物理數(shù)據(jù)空間中的移動(dòng)。
81.一種搜索方法,包括步驟提供探測器,用于探測所關(guān)注的對象;采用用于預(yù)測所述對象的行為的模型,處理從所述探測器而來的數(shù)據(jù);以及響應(yīng)于由所述模型輸出的數(shù)據(jù),將所述探測器指引到所述對象。
全文摘要
一種系統(tǒng)和方法,用于進(jìn)行地理和其它搜索任務(wù)的一組代理的分散協(xié)作控制。該方法是基于行為的,對于搜索問題使用了概率質(zhì)點(diǎn)方法。代理被虛擬概率質(zhì)點(diǎn)形式的概率分布所吸引,所述虛擬概率質(zhì)點(diǎn)表示與所關(guān)注對象在地理區(qū)域或數(shù)據(jù)空間中的存在有關(guān)的假設(shè)。通過在周期性的更新消息之間,模擬其它組員和所關(guān)注對象的移動(dòng),來減小對可靠的高帶寬通信的依賴。
文檔編號G05D1/12GK1985223SQ200580023541
公開日2007年6月20日 申請日期2005年7月15日 優(yōu)先權(quán)日2004年7月15日
發(fā)明者邁克爾·D·霍華德, 戴維·佩頓, 溫德爾·布拉德肖, 蒂莫西·史密斯 申請人:雷聲公司