本公開涉及自動化決策制定,并且特別涉及用于分析概率樹的結(jié)構(gòu)的系統(tǒng)和方法。
背景技術(shù):
1、人工智能(ai)可用于自主或半自主車輛,以確定車輛要采取的動作。ai算法被應(yīng)用于通過生成概率樹來計(jì)算和確定半自主和全自主車輛的駕駛行為。概率樹(每個頂點(diǎn)上具有概率的根圖)是許多自動化系統(tǒng)(例如,做出自動化決策的系統(tǒng)或機(jī)器,例如自動化車輛)中使用的常見數(shù)據(jù)結(jié)構(gòu)。這種樹的一個示例是蒙特卡羅樹搜索(mcts),其生成概率樹結(jié)構(gòu)作為順序決策制定的輸出。為了達(dá)到?jīng)Q策,該算法構(gòu)建概率樹數(shù)據(jù)結(jié)構(gòu),其中根節(jié)點(diǎn)是當(dāng)前狀態(tài),并且每個頂點(diǎn)是可以從根節(jié)點(diǎn)采取的不同動作。
技術(shù)實(shí)現(xiàn)思路
1、本文公開了一種執(zhí)行概率樹分析的方法。該方法包括標(biāo)識概率樹中的多個節(jié)點(diǎn),其中多個節(jié)點(diǎn)中的每個具有概率向量。為多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值。至少一個節(jié)點(diǎn)結(jié)構(gòu)值量化從多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的熵。至少一個節(jié)點(diǎn)結(jié)構(gòu)值被分配給多個節(jié)點(diǎn)中的對應(yīng)一個。輸出經(jīng)分析的概率樹,其包括分配給多個節(jié)點(diǎn)中的對應(yīng)一個的至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
2、本公開的另一方面可以是其中所述熵定義從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的跨度。
3、本公開的另一方面可以是其中所述子樹包括從其延伸的至少一個分支,并且所述概率向量包括與延伸的至少一個分支中的分支的數(shù)量相匹配的值的數(shù)量,其中所述概率向量中的值對應(yīng)于從其延伸的子樹的大小。
4、本公開的另一方面可以是其中所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值包括標(biāo)準(zhǔn)化節(jié)點(diǎn)結(jié)構(gòu)值和非標(biāo)準(zhǔn)化節(jié)點(diǎn)結(jié)構(gòu)值。
5、本公開的另一方面可以是其中所述標(biāo)準(zhǔn)化節(jié)點(diǎn)結(jié)構(gòu)值提供用于所述概率樹的不同層之間的比較的值。
6、本公開的另一方面可以是其中所述概率樹是從蒙特卡羅樹搜索生成的。
7、本公開的另一方面可以包括基于經(jīng)分析的概率樹中的至少一個節(jié)點(diǎn)結(jié)構(gòu)值來生成更新概率樹。
8、本公開的另一方面可以包括基于經(jīng)分析的概率樹來生成更新概率樹。在更新概率樹中標(biāo)識多個節(jié)點(diǎn)。為更新概率樹中的多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值。將至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給更新概率樹中的多個節(jié)點(diǎn)中的對應(yīng)一個。輸出更新概率樹,其包括分配給多個節(jié)點(diǎn)中的對應(yīng)一個的至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
9、本公開的另一方面可以是其中經(jīng)分析的概率樹使更新概率樹前進(jìn)至少一個時間步長。
10、本公開的另一方面可以是其中概率樹是在標(biāo)識概率樹中的多個節(jié)點(diǎn)之前生成的。
11、本公開的另一方面可以是其中標(biāo)識多個節(jié)點(diǎn)并為多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值發(fā)生在利用構(gòu)建算法生成概率樹期間。
12、本公開的另一方面可以是其中更新概率樹包括至少一個節(jié)點(diǎn),其對應(yīng)于概率樹中具有從其延伸的縮減跨度的節(jié)點(diǎn)。
13、本公開的另一方面可以包括通過比較概率樹和更新概率樹之間的至少一個對應(yīng)節(jié)點(diǎn)的至少一個節(jié)點(diǎn)結(jié)構(gòu)值來確定概率樹和更新概率樹之間的相似程度。
14、本公開的另一方面可以包括在經(jīng)分析的概率樹的至少一個節(jié)點(diǎn)結(jié)構(gòu)值為預(yù)定值以下的情況下,增加從更新概率樹中的多個節(jié)點(diǎn)中的至少一個節(jié)點(diǎn)跨開的分支的數(shù)量。
15、本公開的另一方面可以包括在經(jīng)分析的概率樹的至少一個節(jié)點(diǎn)結(jié)構(gòu)值大于預(yù)定結(jié)構(gòu)值的情況下,限制從更新概率樹中的多個節(jié)點(diǎn)中的至少一個節(jié)點(diǎn)跨開的分支的數(shù)量。
16、本公開的另一方面可以包括提供關(guān)于基于至少一個節(jié)點(diǎn)結(jié)構(gòu)值從概率樹考慮的可能決策的解釋。
17、本文公開了一種包含編程指令的非暫時性計(jì)算機(jī)可讀介質(zhì),所述編程指令當(dāng)由處理器執(zhí)行時,可操作用于執(zhí)行一種方法。該方法包括標(biāo)識概率樹中的多個節(jié)點(diǎn),其中所述多個節(jié)點(diǎn)中的每個包括概率向量。為所述多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值,其中所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值量化從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的熵。將所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個。輸出經(jīng)分析的概率樹,其包括分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個的所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
18、本文公開了一種自動化系統(tǒng)。自動化系統(tǒng)包括多個傳感器和與多個傳感器通信的控制器??刂破鞅慌渲贸蓸?biāo)識概率樹中的多個節(jié)點(diǎn),其中多個節(jié)點(diǎn)中的每個包括概率向量??刂破鬟€被配置成為多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值,其中所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值量化從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的熵。控制器還被配置成將所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個,并輸出經(jīng)分析的概率樹,其包括分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個的所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
19、本文公開了以下方案:
20、方案1.一種執(zhí)行概率樹分析的方法,所述方法包括:
21、標(biāo)識概率樹中的多個節(jié)點(diǎn),其中所述多個節(jié)點(diǎn)中的每個包括概率向量;
22、為所述多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值,其中所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值量化從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的熵;
23、將所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個;和
24、輸出經(jīng)分析的概率樹,其包括分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個的所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
25、方案2.根據(jù)方案1所述的方法,其中,所述熵定義從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的跨度。
26、方案3.根據(jù)方案1所述的方法,其中,所述子樹包括從其延伸的至少一個分支,并且所述概率向量包括與從其延伸的至少一個分支中的分支的數(shù)量相匹配的值的數(shù)量,其中所述概率向量中的值對應(yīng)于從其延伸的子樹的大小。
27、方案4.根據(jù)方案1所述的方法,其中,所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值包括標(biāo)準(zhǔn)化節(jié)點(diǎn)結(jié)構(gòu)值和非標(biāo)準(zhǔn)化節(jié)點(diǎn)結(jié)構(gòu)值。
28、方案5.根據(jù)方案4所述的方法,其中,所述標(biāo)準(zhǔn)化節(jié)點(diǎn)結(jié)構(gòu)值提供用于所述概率樹的不同層之間的比較的值。
29、方案6.根據(jù)方案1所述的方法,其中,所述概率樹是從蒙特卡羅樹搜索生成的。
30、方案7.根據(jù)方案1所述的方法,包括基于經(jīng)分析的概率樹中的至少一個節(jié)點(diǎn)結(jié)構(gòu)值來生成更新概率樹。
31、方案8.根據(jù)方案7所述的方法,包括:
32、基于經(jīng)分析的概率樹來生成更新概率樹;
33、標(biāo)識更新概率樹中的多個節(jié)點(diǎn);
34、為更新概率樹中的多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值;
35、將至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給更新概率樹中的多個節(jié)點(diǎn)中的對應(yīng)一個;和輸出更新概率樹,其包括分配給多個節(jié)點(diǎn)中的對應(yīng)一個的至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
36、方案9.根據(jù)方案8所述的方法,其中,經(jīng)分析的概率樹使更新概率樹前進(jìn)至少一個時間步長。
37、方案10.根據(jù)方案1所述的方法,其中,概率樹是在標(biāo)識概率樹中的多個節(jié)點(diǎn)之前生成的。
38、方案11.根據(jù)方案1所述的方法,其中,標(biāo)識多個節(jié)點(diǎn)并為多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值發(fā)生在利用構(gòu)建算法生成概率樹期間。
39、方案12.根據(jù)方案8所述的方法,其中,更新概率樹包括至少一個節(jié)點(diǎn),其對應(yīng)于概率樹中具有從其延伸的縮減跨度的節(jié)點(diǎn)。
40、方案13.根據(jù)方案8所述的方法,包括通過比較概率樹和更新概率樹之間的至少一個對應(yīng)節(jié)點(diǎn)的至少一個節(jié)點(diǎn)結(jié)構(gòu)值來確定概率樹和更新概率樹之間的相似程度。
41、方案14.根據(jù)方案8所述的方法,包括在經(jīng)分析的概率樹的至少一個節(jié)點(diǎn)結(jié)構(gòu)值為預(yù)定值以下的情況下,增加從更新概率樹中的多個節(jié)點(diǎn)中的至少一個節(jié)點(diǎn)跨開的分支的數(shù)量。
42、方案15.根據(jù)方案8所述的方法,包括在經(jīng)分析的概率樹的至少一個節(jié)點(diǎn)結(jié)構(gòu)值大于預(yù)定結(jié)構(gòu)值的情況下,限制從更新概率樹中的多個節(jié)點(diǎn)中的至少一個節(jié)點(diǎn)跨開的分支的數(shù)量。
43、方案16.根據(jù)方案1所述的方法,包括提供關(guān)于基于至少一個節(jié)點(diǎn)結(jié)構(gòu)值從概率樹考慮的可能決策的解釋。
44、方案17.一種包含編程指令的非暫時性計(jì)算機(jī)可讀介質(zhì),所述編程指令當(dāng)由處理器執(zhí)行時,可操作用于執(zhí)行一種方法,所述方法包括:
45、標(biāo)識概率樹中的多個節(jié)點(diǎn),其中所述多個節(jié)點(diǎn)中的每個包括概率向量;
46、為所述多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值,其中所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值量化從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的熵;
47、將所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個;和
48、輸出經(jīng)分析的概率樹,其包括分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個的所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
49、方案18.根據(jù)方案17所述的計(jì)算機(jī)可讀介質(zhì),其中,所述熵定義從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的跨度。
50、方案19.根據(jù)方案17所述的計(jì)算機(jī)可讀介質(zhì),其中,所述方法包括:
51、基于經(jīng)分析的概率樹來生成更新概率樹;
52、標(biāo)識更新概率樹中的多個節(jié)點(diǎn);
53、為更新概率樹中的多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值;
54、將至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給更新概率樹中的多個節(jié)點(diǎn)中的對應(yīng)一個;和輸出更新概率樹,其包括分配給多個節(jié)點(diǎn)中的對應(yīng)一個的至少一個節(jié)點(diǎn)結(jié)構(gòu)值。
55、方案20.一種自動化系統(tǒng),包括:
56、多個傳感器;
57、控制器,其與所述多個傳感器通信并且被配置成:
58、標(biāo)識概率樹中的多個節(jié)點(diǎn),其中所述多個節(jié)點(diǎn)中的每個包括概率向量;
59、為所述多個節(jié)點(diǎn)中的每個計(jì)算至少一個節(jié)點(diǎn)結(jié)構(gòu)值,其中所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值量化從所述多個節(jié)點(diǎn)中的對應(yīng)一個延伸的子樹的熵;
60、將所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個;和
61、輸出經(jīng)分析的概率樹,其包括分配給所述多個節(jié)點(diǎn)中的對應(yīng)一個的所述至少一個節(jié)點(diǎn)結(jié)構(gòu)值。