車輛控制方法和裝置以及決策模型的獲取方法和裝置的制造方法
【專利摘要】本發(fā)明公開(kāi)了車輛控制方法和裝置以及決策模型的獲取方法和裝置,所述車輛控制方法包括:在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息;根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,根據(jù)確定出的車輛狀態(tài)信息對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。應(yīng)用本發(fā)明所述方案,能夠提高安全性和減少工作量。
【專利說(shuō)明】
車輛控制方法和裝置以及決策模型的獲取方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及無(wú)人駕駛技術(shù),特別涉及無(wú)人駕駛車輛的控制方法和裝置以及決策模型的獲取方法和裝置。
【【背景技術(shù)】】
[0002]在無(wú)人駕駛車輛的行駛過(guò)程中,需要根據(jù)獲取到的地圖信息和外界環(huán)境信息來(lái)實(shí)時(shí)地作出決策,所述決策包括:剎車、加速、變道、轉(zhuǎn)向、調(diào)頭、倒車等,并根據(jù)決策結(jié)果來(lái)對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0003]現(xiàn)有技術(shù)中,可基于人工預(yù)先編輯的一些規(guī)則來(lái)進(jìn)行決策,但是,人工編輯的規(guī)則通常無(wú)法覆蓋所有的路況,對(duì)于沒(méi)有對(duì)應(yīng)規(guī)則的未知路況,會(huì)存在很大的安全隱患,而且,人工編輯的規(guī)則過(guò)多,也會(huì)增加編輯和維護(hù)的工作量。
【
【發(fā)明內(nèi)容】
】
[0004]本發(fā)明提供了車輛控制方法和裝置以及決策模型的獲取方法和裝置,能夠提高安全性和減少工作量。
[0005]具體技術(shù)方案如下:
[0006]—種車輛控制方法,包括:
[0007]在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息;
[0008]根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,根據(jù)確定出的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0009]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息包括:
[0010]將每次獲取到的外界環(huán)境信息和地圖信息進(jìn)行整合后,作為所述決策模型的輸入,獲取所述決策模型輸出的所述車輛狀態(tài)信息。
[0011 ]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,
[0012]所述地圖信息為:基于高精地圖獲取到的地圖信息;
[0013]所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。
[0014]一種決策模型的獲取方法,包括:
[0015]當(dāng)駕駛員駕駛車輛在道路上行駛時(shí),實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息;
[0016]信息獲取完畢,根據(jù)獲取到的信息,訓(xùn)練得到體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,以便在無(wú)人駕駛車輛的行駛過(guò)程中,在每次獲取到當(dāng)前的外界環(huán)境信息和地圖信息后,根據(jù)所述決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,并根據(jù)確定出的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0017]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,訓(xùn)練得到所述決策模型包括:
[0018]利用每次獲取到的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本,并且,將每個(gè)訓(xùn)練樣本中的外界環(huán)境信息和地圖信息進(jìn)行整合后作為該訓(xùn)練樣本中的輸入,將每個(gè)訓(xùn)練樣本中的車輛狀態(tài)信息作為該訓(xùn)練樣本中的輸出;
[0019]根據(jù)各訓(xùn)練樣本中的輸入和輸出訓(xùn)練得到所述決策模型。
[0020]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,該方法進(jìn)一步包括:
[0021]從各訓(xùn)練樣本中篩除包含異常數(shù)據(jù)的訓(xùn)練樣本,根據(jù)剩余的訓(xùn)練樣本訓(xùn)練得到所述決策模型。
[0022]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,
[0023]所述地圖信息為:基于高精地圖獲取到的地圖信息;
[0024]所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。
[0025]—種車輛控制裝置,包括:獲取單元、決策單元和控制單元;
[0026]所述獲取單元,用于在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息,并將每次獲取到的外界環(huán)境信息和地圖信息發(fā)送給所述決策單元;
[0027]所述決策單元,用于根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次接收到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,將確定出的車輛狀態(tài)信息發(fā)送給所述控制單元;
[0028]所述控制單元,用于根據(jù)接收到的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0029]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述決策單元將每次接收到的外界環(huán)境信息和地圖信息進(jìn)行整合后,作為所述決策模型的輸入,獲取所述決策模型輸出的所述車輛狀態(tài)信息。
[0030]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,
[0031]所述地圖信息為:基于高精地圖獲取到的地圖信息;
[0032]所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。
[0033]—種決策模型的獲取裝置,包括:數(shù)據(jù)收集單元和模型訓(xùn)練單元;
[0034]所述數(shù)據(jù)收集單元,用于當(dāng)駕駛員駕駛車輛在道路上行駛時(shí),實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息;
[0035]所述模型訓(xùn)練單元,用于當(dāng)數(shù)據(jù)收集完畢后,根據(jù)獲取到的信息,訓(xùn)練得到體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,以便在無(wú)人駕駛車輛的行駛過(guò)程中,在每次獲取到當(dāng)前的外界環(huán)境信息和地圖信息后,能夠根據(jù)所述決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,并根據(jù)確定出的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0036]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述模型訓(xùn)練單元利用所述數(shù)據(jù)收集單元每次獲取到的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本,并且,將每個(gè)訓(xùn)練樣本中的外界環(huán)境信息和地圖信息進(jìn)行整合后作為該訓(xùn)練樣本中的輸入,將每個(gè)訓(xùn)練樣本中的車輛狀態(tài)信息作為該訓(xùn)練樣本中的輸出,根據(jù)各訓(xùn)練樣本中的輸入和輸出訓(xùn)練得到所述決策模型。
[0037]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,所述模型訓(xùn)練單元進(jìn)一步用于,
[0038]從各訓(xùn)練樣本中篩除包含異常數(shù)據(jù)的訓(xùn)練樣本,根據(jù)剩余的訓(xùn)練樣本訓(xùn)練得到所述決策模型。
[0039]根據(jù)本發(fā)明一優(yōu)選實(shí)施例,
[0040]所述地圖信息為:基于高精地圖獲取到的地圖信息;
[0041]所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。
[0042]基于上述介紹可以看出,采用本發(fā)明所述方案,在無(wú)人駕駛車輛的行駛過(guò)程中,可實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息,并根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,進(jìn)而根據(jù)確定出的車輛狀態(tài)信息對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制,相比于現(xiàn)有技術(shù),本發(fā)明所述方案可適用于任意路況,提高了對(duì)未知路況的決策能力,從而提高了安全性,而且,由于不需要人工來(lái)編輯規(guī)則,因此減少了編輯和維護(hù)的工作量。
【【附圖說(shuō)明】】
[0043]圖1為本發(fā)明車輛控制方法實(shí)施例的流程圖。
[0044]圖2為本發(fā)明決策模型的獲取方法實(shí)施例的流程圖。
[0045]圖3為本發(fā)明車輛控制裝置實(shí)施例的組成結(jié)構(gòu)示意圖。
[0046]圖4為本發(fā)明決策模型的獲取裝置實(shí)施例的組成結(jié)構(gòu)示意圖。
【【具體實(shí)施方式】】
[0047]為了使本發(fā)明的技術(shù)方案更加清楚、明白,以下參照附圖并舉實(shí)施例,對(duì)本發(fā)明所述方案作進(jìn)一步地詳細(xì)說(shuō)明。
[0048]實(shí)施例一
[0049]圖1為本發(fā)明車輛控制方法實(shí)施例的流程圖,如圖1所示,包括以下具體實(shí)現(xiàn)方式。
[0050]在11中,在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息。
[0051]在無(wú)人駕駛車輛的行駛過(guò)程中,可實(shí)時(shí)地獲取當(dāng)前的外界環(huán)境信息和地圖信息,這里所提到的實(shí)時(shí)獲取,不是絕對(duì)意義上的一直連續(xù)不斷地獲取,而是指以很小的周期時(shí)長(zhǎng)進(jìn)行周期性獲取,比如,以0.5秒作為周期時(shí)長(zhǎng)。
[0052]外界環(huán)境信息也可稱為感知信息,可通過(guò)激光雷達(dá)、毫米波雷達(dá)和攝像機(jī)等實(shí)時(shí)獲取無(wú)人駕駛車輛周圍的環(huán)境信息,可包括:周圍車輛的位置、大小、速度、方向;周圍行人的位置、速度、方向等。
[0053]其中,周圍車輛的位置通常是指周圍車輛相對(duì)于無(wú)人駕駛車輛的位置,同樣地,周圍行人的位置是指周圍行人相對(duì)于無(wú)人駕駛車輛的位置。
[0054]獲取到的地圖信息為基于高精地圖獲取到的地圖信息。
[0055]傳統(tǒng)的普通地圖中只包含簡(jiǎn)單的道路路徑信息,而高精地圖中會(huì)詳細(xì)到每條車道線的精確位置、車道的曲率、車道的限速、車道的連接屬性等信息,即相比于普通地圖,高精地圖中包含的信息內(nèi)容更為豐富詳細(xì),同時(shí)具有更小的誤差。
[0056]本實(shí)施例中所述的獲取到的地圖信息,是指根據(jù)高精地圖實(shí)時(shí)獲取到的無(wú)人駕駛車輛周圍的地圖數(shù)據(jù),可包括:車輛的坐標(biāo);車輛前方是否有路口、高架橋、紅綠燈、停止線等。
[0057]其中,車輛的坐標(biāo)通常是指無(wú)人駕駛車輛與所在車道兩側(cè)的車道線之間的距離等,判斷車輛前方是否有路口等,通常是指判斷無(wú)人駕駛車輛前方預(yù)定距離如200米內(nèi)是否存在路口等。
[0058]在12中,根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息。
[0059]可將每次獲取到的外界環(huán)境信息和地圖信息進(jìn)行進(jìn)行整合后,作為預(yù)先訓(xùn)練得到的決策模型的輸入,從而獲取到?jīng)Q策模型輸出的車輛狀態(tài)信息。
[0060]車輛狀態(tài)信息可包括:車輛的速度、加速度、方向盤的角度、方向盤的角速度、轉(zhuǎn)向燈的狀態(tài)、遠(yuǎn)光燈的狀態(tài)、近光燈的狀態(tài)等。
[0061 ]轉(zhuǎn)向燈的狀態(tài)是指轉(zhuǎn)向燈是否打開(kāi),打開(kāi)的是哪一側(cè)的轉(zhuǎn)向燈等,遠(yuǎn)光燈的狀態(tài)是指遠(yuǎn)光燈是否打開(kāi)等,近光燈的狀態(tài)是指近光燈是否打開(kāi)等。
[0062]在13中,根據(jù)確定出的車輛狀態(tài)信息對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0063]可根據(jù)確定出的車輛狀態(tài)信息,按照現(xiàn)有技術(shù),對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0064]實(shí)施例一中所述內(nèi)容可舉例如下:
[0065]假設(shè)當(dāng)前時(shí)刻為時(shí)刻a,獲取時(shí)刻a時(shí)的外界環(huán)境信息a和地圖信息a,并根據(jù)決策模型,確定出外界環(huán)境信息a和地圖信息a對(duì)應(yīng)的車輛狀態(tài)信息a,進(jìn)而根據(jù)車輛狀態(tài)信息a對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制;
[0066]假設(shè)下一時(shí)刻為時(shí)刻b,獲取時(shí)刻b時(shí)的外界環(huán)境信息b和地圖信息b,并根據(jù)決策模型,確定出外界環(huán)境信息b和地圖信息b對(duì)應(yīng)的車輛狀態(tài)信息b,進(jìn)而根據(jù)車輛狀態(tài)信息b對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制;
[0067]依此類推;
[0068]時(shí)亥Ija和時(shí)亥Ijb之間可間隔非常短的時(shí)長(zhǎng),以達(dá)到實(shí)時(shí)控制的目的。
[0069]以下通過(guò)實(shí)施例二,對(duì)如何獲取上述決策模型進(jìn)行詳細(xì)說(shuō)明。
[0070]實(shí)施例二
[0071]圖2為本發(fā)明決策模型的獲取方法實(shí)施例的流程圖,如圖2所示,包括以下具體實(shí)現(xiàn)方式。
[0072]在21中,當(dāng)駕駛員駕駛車輛在道路上行駛時(shí),實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息。
[0073]可讓有經(jīng)驗(yàn)、駕駛技術(shù)優(yōu)秀的駕駛員駕駛車輛在道路上行駛,在車輛行駛過(guò)程中,實(shí)時(shí)獲取(采集、收集)當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息。
[0074]可以只利用一個(gè)車輛來(lái)按照上述方式收集信息,也可以同時(shí)或不同時(shí)地利用多個(gè)車輛來(lái)按照上述方式收集信息。
[0075]其中,獲取到的外界環(huán)境信息可包括:周圍車輛的位置、大小、速度、方向;周圍行人的位置、速度、方向等。
[0076]獲取到的地圖信息為基于高精地圖獲取到的地圖信息,可包括:車輛的坐標(biāo);車輛前方是否有路口、高架橋、紅綠燈、停止線等。
[0077]獲取到的車輛狀態(tài)信息可包括:車輛的速度、加速度、方向盤的角度、方向盤的角速度、轉(zhuǎn)向燈的狀態(tài)、遠(yuǎn)光燈的狀態(tài)、近光燈的狀態(tài)等。
[0078]在22中,信息獲取完畢,根據(jù)獲取到的信息,訓(xùn)練得到體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型。
[0079]當(dāng)收集到足夠多的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之后,即可進(jìn)行決策豐吳型的訓(xùn)練。
[0080]比如,可將每次獲取到的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本,并且,將每個(gè)訓(xùn)練樣本中的外界環(huán)境信息和地圖信息進(jìn)行整合后作為該訓(xùn)練樣本中的輸入,將每個(gè)訓(xùn)練樣本中的車輛狀態(tài)信息作為該訓(xùn)練樣本中的輸出,根據(jù)各訓(xùn)練樣本中的輸入和輸出訓(xùn)練得到?jīng)Q策模型。
[0081]即利用同一時(shí)刻獲取到的、相互對(duì)應(yīng)的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本。
[0082]將外界環(huán)境信息和地圖信息進(jìn)行整合,是指對(duì)兩部分信息進(jìn)行合并處理等,將整后的信息作為輸入,對(duì)應(yīng)的車輛狀態(tài)信息作為輸出,來(lái)訓(xùn)練出決策模型。
[0083]另外,還可從各訓(xùn)練樣本中篩除包含異常數(shù)據(jù)的訓(xùn)練樣本,根據(jù)剩余的訓(xùn)練樣本訓(xùn)練得到?jīng)Q策模型。
[0084]比如,根據(jù)經(jīng)驗(yàn),周圍行人的速度不會(huì)大于閾值A(chǔ),但某一訓(xùn)練樣本中的周圍行人的速度超過(guò)了閾值A(chǔ),那么則可認(rèn)為該信息獲取有誤,相應(yīng)地,將該訓(xùn)練樣本篩除。
[0085]根據(jù)篩除后剩余的訓(xùn)練樣本,來(lái)訓(xùn)練得到?jīng)Q策模型,所述決策模型的類型可包括:支持向量機(jī)(SVM,Support Vector Machine)模型或神經(jīng)網(wǎng)絡(luò)模型等。
[0086]如何訓(xùn)練得到所述決策模型為現(xiàn)有技術(shù),比如,可在訓(xùn)練樣本中的輸入和輸出的基礎(chǔ)上選取指定特征,根據(jù)選取出的指定特征進(jìn)行模型訓(xùn)練,并可在訓(xùn)練迭代的過(guò)程中不斷優(yōu)化所選取的特征。
[0087]可將訓(xùn)練得到的決策模型提供給無(wú)人駕駛車輛使用,無(wú)人駕駛車輛在行駛的過(guò)程中,會(huì)實(shí)時(shí)地獲取當(dāng)前的外界環(huán)境信息和地圖信息,在每次獲取到外界環(huán)境信息和地圖信息之后,即可根據(jù)決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,進(jìn)而根據(jù)確定出的車輛狀態(tài)信息對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0088]以上是關(guān)于本發(fā)明方法實(shí)施例的介紹,以下通過(guò)實(shí)施例三和實(shí)施例四,對(duì)本發(fā)明所述裝置實(shí)施例進(jìn)行介紹。
[0089]實(shí)施例三
[0090]圖3為本發(fā)明車輛控制裝置實(shí)施例的組成結(jié)構(gòu)示意圖,如圖3所示,包括:獲取單元31、決策單元32和控制單元33。
[0091]獲取單元31,用于在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息,并將每次獲取到的外界環(huán)境信息和地圖信息發(fā)送給決策單元32;
[0092]決策單元32,用于根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次接收到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,將確定出的車輛狀態(tài)信息發(fā)送給控制單元33;
[0093]控制單元33,用于根據(jù)接收到的車輛狀態(tài)信息對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0094]在無(wú)人駕駛車輛的行駛過(guò)程中,獲取單元31可實(shí)時(shí)地獲取當(dāng)前的外界環(huán)境信息和地圖信息,并可將每次獲取到的外界環(huán)境信息和地圖信息發(fā)送給決策單元32,以便決策單元32進(jìn)行決策。
[0095]獲取到的外界環(huán)境信息可包括:周圍車輛的位置、大小、速度、方向;周圍行人的位置、速度、方向等。
[0096]獲取到的地圖信息為基于高精地圖獲取到的地圖信息,可包括:車輛的坐標(biāo);車輛前方是否有路口、高架橋、紅綠燈、停止線等。
[0097]決策單元32可將每次接收到的外界環(huán)境信息和地圖進(jìn)行進(jìn)行整合后,作為預(yù)先訓(xùn)練得到的決策模型的輸入,從而獲取到?jīng)Q策模型輸出的車輛狀態(tài)信息,決策模型的類型可包括:SVM模型、神經(jīng)網(wǎng)絡(luò)模型等。
[0098]車輛狀態(tài)信息可包括:車輛的速度、加速度、方向盤的角度、方向盤的角速度、轉(zhuǎn)向燈的狀態(tài)、遠(yuǎn)光燈的狀態(tài)、近光燈的狀態(tài)等。
[0099]決策單元32可將確定出的車輛狀態(tài)信息發(fā)送給控制單元33,相應(yīng)地,控制單元33可根據(jù)接收到的車輛狀態(tài)信息,按照現(xiàn)有技術(shù),對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0100]實(shí)施例四
[0101]圖4為本發(fā)明決策模型的獲取裝置實(shí)施例的組成結(jié)構(gòu)示意圖,如圖4所示,包括:數(shù)據(jù)收集單元41和模型訓(xùn)練單元42。
[0102]數(shù)據(jù)收集單元41,用于當(dāng)駕駛員駕駛車輛在道路上行駛時(shí),實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息;
[0103]模型訓(xùn)練單元42,用于當(dāng)數(shù)據(jù)收集完畢后,根據(jù)獲取到的信息,訓(xùn)練得到體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,以便在無(wú)人駕駛車輛的行駛過(guò)程中,在每次獲取到當(dāng)前的外界環(huán)境信息和地圖信息后,根據(jù)決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,并根據(jù)確定出的車輛狀態(tài)信息對(duì)無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。
[0104]可讓有經(jīng)驗(yàn)、駕駛技術(shù)優(yōu)秀的駕駛員駕駛車輛在道路上行駛,在車輛行駛過(guò)程中,數(shù)據(jù)收集單元41可實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息。
[0105]可以只利用一個(gè)車輛來(lái)按照上述方式收集信息,也可以同時(shí)或不同時(shí)地利用多個(gè)車輛來(lái)按照上述方式收集信息。
[0106]獲取到的外界環(huán)境信息可包括:周圍車輛的位置、大小、速度、方向;周圍行人的位置、速度、方向等。
[0107]獲取到的地圖信息為基于高精地圖獲取到的地圖信息,可包括:車輛的坐標(biāo);車輛前方是否有路口、高架橋、紅綠燈、停止線等。
[0108]獲取到的車輛狀態(tài)信息可包括:車輛的速度、加速度、方向盤的角度、方向盤的角速度、轉(zhuǎn)向燈的狀態(tài)、遠(yuǎn)光燈的狀態(tài)、近光燈的狀態(tài)等。
[0109]當(dāng)收集到足夠多的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之后,即可由模型訓(xùn)練單元42來(lái)進(jìn)行決策模型的訓(xùn)練。
[0110]比如,模型訓(xùn)練單元42可將每次獲取到的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本,并且,將每個(gè)訓(xùn)練樣本中的外界環(huán)境信息和地圖信息進(jìn)行整合后作為該訓(xùn)練樣本中的輸入,將每個(gè)訓(xùn)練樣本中的車輛狀態(tài)信息作為該訓(xùn)練樣本中的輸出,根據(jù)各訓(xùn)練樣本中的輸入和輸出訓(xùn)練得到?jīng)Q策模型。
[0111]另外,模型訓(xùn)練單元42還可從各訓(xùn)練樣本中篩除包含異常數(shù)據(jù)的訓(xùn)練樣本,根據(jù)剩余的訓(xùn)練樣本訓(xùn)練得到?jīng)Q策模型。
[0112]比如,根據(jù)經(jīng)驗(yàn),周圍行人的速度不會(huì)大于閾值A(chǔ),但某一訓(xùn)練樣本中的周圍行人的速度超過(guò)了閾值A(chǔ),那么則可認(rèn)為該信息獲取有誤,相應(yīng)地,將該訓(xùn)練樣本篩除。
[0113]模型訓(xùn)練單元42根據(jù)篩除后剩余的訓(xùn)練樣本,來(lái)訓(xùn)練得到?jīng)Q策模型,所述決策模型的類型可包括:SVM模型或神經(jīng)網(wǎng)絡(luò)模型等。
[0114]如何訓(xùn)練得到所述決策模型為現(xiàn)有技術(shù),比如,可在訓(xùn)練樣本中的輸入和輸出的基礎(chǔ)上選取指定特征,根據(jù)選取出的指定特征進(jìn)行模型訓(xùn)練,并可在訓(xùn)練迭代的過(guò)程中不斷優(yōu)化所選取的特征。
[0115]模型訓(xùn)練單元42可將訓(xùn)練得到的決策模型提供給無(wú)人駕駛車輛使用,無(wú)人駕駛車輛在行駛的過(guò)程中,會(huì)實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息,在每次獲取到外界環(huán)境信息和地圖信息之后,即可根據(jù)決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,進(jìn)而根據(jù)確定出的車輛狀態(tài)信息對(duì)車輛行駛狀態(tài)進(jìn)行控制。
[0116]基于上述各實(shí)施例中的介紹可知,本發(fā)明所述方案可適用于任意路況,從而提高了安全性,而且,由于不需要人工來(lái)編輯規(guī)則,因此減少了對(duì)規(guī)則進(jìn)行編輯和維護(hù)的工作量,另外,本發(fā)明所述方案實(shí)現(xiàn)起來(lái)簡(jiǎn)單方便,從而便于進(jìn)行普及和推廣。
[0117]本發(fā)明提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置和方法,可以通過(guò)其它的方式實(shí)現(xiàn)。例如,以上所描述的裝置實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式。
[0118]所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。
[0119]另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
[0120]上述以軟件功能單元的形式實(shí)現(xiàn)的集成的單元,可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。上述軟件功能單元存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)或處理器(processor)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(R0M,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
[0121]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【主權(quán)項(xiàng)】
1.一種車輛控制方法,其特征在于,包括: 在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息; 根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,根據(jù)確定出的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。2.根據(jù)權(quán)利要求1所述的車輛控制方法,其特征在于, 所述確定出每次獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息包括: 將每次獲取到的外界環(huán)境信息和地圖信息進(jìn)行整合后,作為所述決策模型的輸入,獲取所述決策模型輸出的所述車輛狀態(tài)信息。3.根據(jù)權(quán)利要求1或2所述的車輛控制方法,其特征在于, 所述地圖信息為:基于高精地圖獲取到的地圖信息; 所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。4.一種決策模型的獲取方法,其特征在于,包括: 當(dāng)駕駛員駕駛車輛在道路上行駛時(shí),實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息; 信息獲取完畢,根據(jù)獲取到的信息,訓(xùn)練得到體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,以便在無(wú)人駕駛車輛的行駛過(guò)程中,在每次獲取到當(dāng)前的外界環(huán)境信息和地圖信息后,根據(jù)所述決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,并根據(jù)確定出的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。5.根據(jù)權(quán)利要求4所述的決策模型的獲取方法,其特征在于, 訓(xùn)練得到所述決策模型包括: 利用每次獲取到的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本,并且,將每個(gè)訓(xùn)練樣本中的外界環(huán)境信息和地圖信息進(jìn)行整合后作為該訓(xùn)練樣本中的輸入,將每個(gè)訓(xùn)練樣本中的車輛狀態(tài)信息作為該訓(xùn)練樣本中的輸出; 根據(jù)各訓(xùn)練樣本中的輸入和輸出訓(xùn)練得到所述決策模型。6.根據(jù)權(quán)利要求5所述的決策模型的獲取方法,其特征在于, 該方法進(jìn)一步包括: 從各訓(xùn)練樣本中篩除包含異常數(shù)據(jù)的訓(xùn)練樣本,根據(jù)剩余的訓(xùn)練樣本訓(xùn)練得到所述決策模型。7.根據(jù)權(quán)利要求4、5或6所述的決策模型的獲取方法,其特征在于, 所述地圖信息為:基于高精地圖獲取到的地圖信息; 所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。8.一種車輛控制裝置,其特征在于,包括:獲取單元、決策單元和控制單元; 所述獲取單元,用于在無(wú)人駕駛車輛的行駛過(guò)程中,實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息和地圖信息,并將每次獲取到的外界環(huán)境信息和地圖信息發(fā)送給所述決策單元; 所述決策單元,用于根據(jù)預(yù)先訓(xùn)練得到的、體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,確定出每次接收到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,將確定出的車輛狀態(tài)信息發(fā)送給所述控制單元; 所述控制單元,用于根據(jù)接收到的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。9.根據(jù)權(quán)利要求8所述的車輛控制裝置,其特征在于, 所述決策單元將每次接收到的外界環(huán)境信息和地圖信息進(jìn)行整合后,作為所述決策模型的輸入,獲取所述決策模型輸出的所述車輛狀態(tài)信息。10.根據(jù)權(quán)利要求8或9所述的車輛控制裝置,其特征在于, 所述地圖信息為:基于高精地圖獲取到的地圖信息; 所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。11.一種決策模型的獲取裝置,其特征在于,包括:數(shù)據(jù)收集單元和模型訓(xùn)練單元; 所述數(shù)據(jù)收集單元,用于當(dāng)駕駛員駕駛車輛在道路上行駛時(shí),實(shí)時(shí)獲取當(dāng)前的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息; 所述模型訓(xùn)練單元,用于當(dāng)數(shù)據(jù)收集完畢后,根據(jù)獲取到的信息,訓(xùn)練得到體現(xiàn)外界環(huán)境信息、地圖信息和車輛狀態(tài)信息之間的對(duì)應(yīng)關(guān)系的決策模型,以便在無(wú)人駕駛車輛的行駛過(guò)程中,在每次獲取到當(dāng)前的外界環(huán)境信息和地圖信息后,能夠根據(jù)所述決策模型,確定出獲取到的外界環(huán)境信息和地圖信息對(duì)應(yīng)的車輛狀態(tài)信息,并根據(jù)確定出的車輛狀態(tài)信息對(duì)所述無(wú)人駕駛車輛的行駛狀態(tài)進(jìn)行控制。12.根據(jù)權(quán)利要求11所述的決策模型的獲取裝置,其特征在于, 所述模型訓(xùn)練單元利用所述數(shù)據(jù)收集單元每次獲取到的外界環(huán)境信息、地圖信息和車輛狀態(tài)信息組成一個(gè)訓(xùn)練樣本,并且,將每個(gè)訓(xùn)練樣本中的外界環(huán)境信息和地圖信息進(jìn)行整合后作為該訓(xùn)練樣本中的輸入,將每個(gè)訓(xùn)練樣本中的車輛狀態(tài)信息作為該訓(xùn)練樣本中的輸出,根據(jù)各訓(xùn)練樣本中的輸入和輸出訓(xùn)練得到所述決策模型。13.根據(jù)權(quán)利要求12所述的決策模型的獲取裝置,其特征在于, 所述模型訓(xùn)練單元進(jìn)一步用于, 從各訓(xùn)練樣本中篩除包含異常數(shù)據(jù)的訓(xùn)練樣本,根據(jù)剩余的訓(xùn)練樣本訓(xùn)練得到所述決策模型。14.根據(jù)權(quán)利要求11、12或13所述的決策模型的獲取裝置,其特征在于, 所述地圖信息為:基于高精地圖獲取到的地圖信息; 所述決策模型的類型包括:支持向量機(jī)SVM模型、神經(jīng)網(wǎng)絡(luò)模型。
【文檔編號(hào)】G06K9/62GK106080590SQ201610407031
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月12日
【發(fā)明人】張?zhí)炖? 楊文利, 潘余昌, 孫浩文
【申請(qǐng)人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司