仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其包括輸入輸出模塊、信息存儲模塊、控制模塊,所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中,所述控制模塊通過調(diào)用所述信息存儲模塊中的信息進(jìn)行生成行為模式,所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù);其中,所述控制模塊進(jìn)一步包括以下三層架構(gòu):反應(yīng)層、認(rèn)知層、元認(rèn)知層,所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成,且各個信息塊之間通過遞歸方式進(jìn)行定義;所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所述信息存儲模塊連接;能夠讓機(jī)器人在僅有少量預(yù)設(shè)知識和預(yù)定義行為的條件下啟動,通過與用戶的不斷交互來強(qiáng)化自身的執(zhí)行能力,自適應(yīng)不同的應(yīng)用場景,滿足不同用戶的個性化需求。
【專利說明】
仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及人工智能技術(shù)領(lǐng)域,特別是一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)。
【背景技術(shù)】
[0002] 機(jī)器人技術(shù)作為20世紀(jì)人類最偉大的發(fā)明之一,自60年代初問世W來,經(jīng)歷40年 的發(fā)展已取得長足的進(jìn)步。工業(yè)機(jī)器人在經(jīng)歷了誕生、成長、成熟期后,已成為制造業(yè)中不 可少的核屯、裝備。特種機(jī)器人作為機(jī)器人家族的后起之秀,由于其用途廣泛而大有后來居 上之勢,仿人形機(jī)器人、農(nóng)業(yè)機(jī)器人、服務(wù)機(jī)器人、水下機(jī)器人、醫(yī)療機(jī)器人、軍用機(jī)器人、娛 樂機(jī)器人等各種用途的特種機(jī)器人紛紛面世,而且正W飛快的速度向?qū)嵱没~進(jìn)。
[0003] 但是,現(xiàn)有技術(shù)中對機(jī)器人的研究大多局限于模仿人類的動作語言、人體造型、人 造肌肉、人造皮膚等,例如模仿人類的步行、發(fā)聲、表情、運(yùn)動等,制造各種美女機(jī)器人等,但 運(yùn)些機(jī)器人一般是為了解決某一特定問題而設(shè)計的,只能根據(jù)預(yù)設(shè)的工作場景來執(zhí)行對應(yīng) 的任務(wù),需要大量的預(yù)先編程和設(shè)置,缺乏一個統(tǒng)一的框架來模擬人的認(rèn)知能力,用戶購買 機(jī)器人后,如果沒有二次開發(fā)的能力,便難W教會機(jī)器人處理新的任務(wù),無法做到像人一樣 自主學(xué)習(xí)、快速適應(yīng)不同的環(huán)境,適用范圍受到極大的限制。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明為解決上述問題,提供了一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),能夠模仿人腦 的自主學(xué)習(xí)過程,自適應(yīng)不同的應(yīng)用場景,滿足不同用戶的個性化需求。
[0005] 為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案為:
[0006] -種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其包括輸入輸出模塊、信息存儲模塊、控制模 塊,所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中,所述控制模塊通過調(diào) 用所述信息存儲模塊中的信息進(jìn)行生成行為模式,并將該行為模式傳送至所述輸入輸出模 塊,所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù);其中,所述控制模塊進(jìn)一步包括W下 Ξ層架構(gòu):反應(yīng)層、認(rèn)知層、元認(rèn)知層,所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成,且 各個信息塊之間通過遞歸方式進(jìn)行定義;所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所述信息存 儲模塊連接,所述反應(yīng)層通過所述信息塊之間的化化ian學(xué)習(xí)進(jìn)行模擬人腦的快速的、本能 的反應(yīng),所述認(rèn)知層對所述反應(yīng)層的學(xué)習(xí)結(jié)果進(jìn)一步運(yùn)用強(qiáng)化學(xué)習(xí)算法進(jìn)行模擬行為學(xué)習(xí) 中反復(fù)試錯的認(rèn)知過程,所述元認(rèn)知層根據(jù)所述認(rèn)知層的學(xué)習(xí)結(jié)果形成新的行為模式。
[0007] 優(yōu)選的,所述信息存儲模塊進(jìn)一步包括注意焦點(diǎn)存儲單元、本地存儲單元、云存儲 單元,其中,所述注意焦點(diǎn)存儲單元用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息,所述云存儲單元 用于備份歷史信息。
[000引優(yōu)選的,所述信息存儲模塊中的信息塊是采用基于廣義圖的知識表示方式和存儲 方式,所述信息塊位于所述廣義圖中的頂點(diǎn)或邊,且所述信息塊之間還可W嵌套組合形成 新的信息塊。
[0009]優(yōu)選的,所述輸入輸出模塊進(jìn)一步包括感知器和執(zhí)行器,所述感知器用于采集信 息并將采集到的信息保存至所述信息存儲模塊中,所述執(zhí)行器用于根據(jù)所述行為模式執(zhí)行 所述控制模塊交付的任務(wù)。
[0010] 優(yōu)選的,所述信息塊中還定義了化化ian關(guān)系的置信度,當(dāng)置信度小于預(yù)設(shè)闊值 時,則刪除對應(yīng)的化化ian關(guān)系。
[0011] 優(yōu)選的,所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào)節(jié)單元、初始化學(xué)習(xí)單 元、信息整理單元,其中,所述系統(tǒng)監(jiān)控單元用于監(jiān)控系統(tǒng)的各個模塊和過程的資源使用情 況,所述參數(shù)調(diào)節(jié)單元根據(jù)所述系統(tǒng)監(jiān)控單元提供的資源使用情況進(jìn)行分配和調(diào)節(jié)系統(tǒng)資 源,所述初始化學(xué)習(xí)單元用于在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前進(jìn)行初始化處理,所述信息 整理單元通過利用遺忘機(jī)制和泛化機(jī)制對所述信息存儲模塊中的信息塊進(jìn)行整理。
[0012] 優(yōu)選的,所述信息存儲模塊中設(shè)有用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息的注意焦 點(diǎn)存儲單元,在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前,所述初始化學(xué)習(xí)單元加載與當(dāng)前任務(wù)緊密 關(guān)聯(lián)的信息塊到所述注意焦點(diǎn)存儲單元中。
[0013] 本發(fā)明的有益效果是:
[0014] (1)、本發(fā)明通過采用由反應(yīng)層、認(rèn)知層、元認(rèn)知層的Ξ層架構(gòu)的控制器實現(xiàn)自主 學(xué)習(xí)功能,能夠讓機(jī)器人在僅有少量預(yù)設(shè)知識和預(yù)定義行為的條件下啟動,通過與用戶的 不斷交互來強(qiáng)化自身的執(zhí)行能力,自適應(yīng)不同的應(yīng)用場景,滿足不同用戶的個性化需求;
[0015] (2)、所述信息存儲模塊進(jìn)一步分為注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單 元,僅將與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息存儲于所述注意焦點(diǎn)存儲單元,提高機(jī)器人的運(yùn)算速 度和工作效率;
[0016] (3)、所述信息塊中還定義了化化ian關(guān)系的置信度,當(dāng)置信度小于預(yù)設(shè)闊值時,貝U 刪除對應(yīng)的化化ian關(guān)系,從而簡化所述信息存儲模塊中的信息結(jié)構(gòu),僅保留有用的信息, 能夠進(jìn)一步提高機(jī)器人的運(yùn)算速度;
[0017] (4)、所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào)節(jié)單元、初始化學(xué)習(xí)單元、信 息整理單元,能夠模擬人腦的抽象能力實現(xiàn)對系統(tǒng)的各個模塊的宏觀調(diào)控;
[0018] (5)、所述控制模塊的反應(yīng)層、認(rèn)知層、元認(rèn)知層分別單獨(dú)與所述信息存儲模塊連 接,系統(tǒng)各模塊各自向所述信息存儲模塊進(jìn)行讀、寫信息,實現(xiàn)高度松禪合的關(guān)聯(lián),從而使 得各個模塊能夠各自使用不同的算法,控制更靈活更方便。
【附圖說明】
[0019] 此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解,構(gòu)成本發(fā)明的一部分,本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中:
[0020] 圖1為本發(fā)明一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)的整體結(jié)構(gòu)示意圖;
[0021] 圖2本發(fā)明的信息塊的結(jié)構(gòu)關(guān)系示意圖;
[0022] 圖3為圖1中的反應(yīng)層的化化ian學(xué)習(xí)示例圖;
[0023] 圖4為圖1中的認(rèn)知層的強(qiáng)化學(xué)習(xí)示例圖。
[0024] 圖5為圖1中的元認(rèn)知層的結(jié)構(gòu)示意圖。
【具體實施方式】
[0025] 為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚、明白,W下結(jié) 合附圖及實施例對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅用 W解釋本發(fā)明,并不用于限定本發(fā)明。
[0026] 本發(fā)明設(shè)及仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),尤其指一種模擬人類屯、理認(rèn)知過程,能 夠自主學(xué)習(xí)與調(diào)控的機(jī)器人系統(tǒng)。本發(fā)明由信息存儲模塊、控制模塊,W及輸入輸出模塊Ξ 大模塊構(gòu)成。
[0027] 如圖1所示,本發(fā)明的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其包括輸入輸出模塊、信 息存儲模塊、控制模塊,所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中,所 述控制模塊通過調(diào)用所述信息存儲模塊中的信息進(jìn)行生成行為模式,并將該行為模式傳送 至所述輸入輸出模塊,所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù)。
[0028] 所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成,且各個信息塊之間通過遞歸方 式進(jìn)行定義;所述信息存儲模塊進(jìn)一步包括注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單 元,其中,所述注意焦點(diǎn)存儲單元用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息,所述云存儲單元用 于備份歷史信息,另外,本地存儲單元則是用于存儲與當(dāng)前任務(wù)較無關(guān)聯(lián)的其他信息。所述 信息存儲模塊中的信息塊是采用基于廣義圖的知識表示方式和存儲方式,所述信息塊位于 所述廣義圖中的頂點(diǎn)或邊,且所述信息塊之間還可W嵌套組合形成新的信息塊(如圖2所 示)。所述信息塊中還定義了化化ian關(guān)系的置信度,當(dāng)置信度小于預(yù)設(shè)闊值時,則刪除對應(yīng) 的化化i an關(guān)系。
[0029] 如圖2所示,本實施例中,所示信息塊是通過如下的遞歸方式進(jìn)行定義的:每個信 息塊Μ是一個由(I,R,0,C)構(gòu)成的四元組,表示從I到0,具有關(guān)系R,置信度為C,其中I,R,0各 自又可W是一個信息塊。最基本的信息塊是I和0均為空集的信息塊,即(0,R,0.C)。例如: 圖2表示從巧化有關(guān)系R,置信度為0.89,而I和0各自又都是信息塊。I表示從B到C有關(guān)系A(chǔ), 置信度為0.35,從D到F有關(guān)系E,置信度為0.74。
[0030] 所述控制模塊進(jìn)一步包括W下Ξ層架構(gòu):反應(yīng)層(如圖3所示)、認(rèn)知層(如圖4所 示)、元認(rèn)知層(如圖5所示),各自模擬人類某一方面的屯、理認(rèn)知能力。所述反應(yīng)層、認(rèn)知層、 元認(rèn)知層分別與所述信息存儲模塊連接,所述反應(yīng)層通過所述信息塊之間的化化ian學(xué)習(xí) 進(jìn)行模擬人腦的快速的、本能的反應(yīng),所述認(rèn)知層對所述反應(yīng)層的學(xué)習(xí)結(jié)果進(jìn)一步運(yùn)用強(qiáng) 化學(xué)習(xí)算法進(jìn)行模擬行為學(xué)習(xí)中反復(fù)試錯的認(rèn)知過程,所述元認(rèn)知層根據(jù)所述認(rèn)知層的學(xué) 習(xí)結(jié)果形成新的行為模式,該元認(rèn)知層還負(fù)責(zé)監(jiān)控系統(tǒng)各模塊的運(yùn)行情況,再通過參數(shù)調(diào) 節(jié)為各模塊分配系統(tǒng)資源,W及學(xué)習(xí)前的初始化和學(xué)習(xí)后的信息存儲模塊整理,通過遺忘 和泛化兩種機(jī)制提高系統(tǒng)運(yùn)行效率和機(jī)器人的適應(yīng)性。。
[0031] 如圖3所示的反應(yīng)層中的化化ian學(xué)習(xí)示例。反應(yīng)層中的學(xué)習(xí)過程模擬的是生物神 經(jīng)元之間的化化ian學(xué)習(xí)。具體實施方法是:每隔一個學(xué)習(xí)時間間隔T,先對注意焦點(diǎn)中的信 息塊,按照它們進(jìn)入注意焦點(diǎn)的時間先后順序進(jìn)行排序。然后,根據(jù)下表所示的規(guī)則,更新、 添加或刪除相鄰兩個信息塊之間的化化ian關(guān)系。
[0032]
[0033] 如圖4所示的認(rèn)知層中的強(qiáng)化學(xué)習(xí)示例。認(rèn)知層中進(jìn)行的強(qiáng)化學(xué)習(xí)過程模擬的是 行為學(xué)習(xí)中反復(fù)試錯的過程。具體實施采用的是強(qiáng)化學(xué)習(xí)中的Q學(xué)習(xí)算法。Q學(xué)習(xí)需要的狀 態(tài)集合S和動作集合A,通過反應(yīng)層中的化化ian關(guān)系得到。例如:圖4表示狀態(tài)集合S= {SO, 51,52,53},在動作集合4=^1,42,43,44,45,46,47,48}下的狀態(tài)轉(zhuǎn)換關(guān)系。信息塊之間的 連線表示化化ian關(guān)系(為保持簡潔,圖4中省略了表示化化ian關(guān)系的信息塊)?;痠an關(guān) 系中的置信度表示相應(yīng)狀態(tài)轉(zhuǎn)換的概率,或者執(zhí)行某個動作后達(dá)成某個狀態(tài)的概率。
[0034] 如圖5所示的元認(rèn)知層的具體設(shè)計方案。元認(rèn)知層模擬的是人的抽象認(rèn)知能力,與 機(jī)器人執(zhí)行的具體任務(wù)無關(guān)。本實施例中,所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào) 節(jié)單元、初始化學(xué)習(xí)單元、信息整理單元,其中,所述系統(tǒng)監(jiān)控單元用于監(jiān)控系統(tǒng)的各個模 塊和過程的資源使用情況,包括CPU、內(nèi)存、存儲容量,W及網(wǎng)絡(luò)請求;所述參數(shù)調(diào)節(jié)單元根 據(jù)所述系統(tǒng)監(jiān)控單元提供的資源使用情況進(jìn)行分配和調(diào)節(jié)系統(tǒng)資源,根據(jù)當(dāng)前系統(tǒng)狀態(tài)W 及任務(wù)需求,為各模塊和過程分配系統(tǒng)資源,調(diào)控感知器、執(zhí)行器W及學(xué)習(xí)過程的具體執(zhí) 行;所述初始化學(xué)習(xí)單元用于在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前進(jìn)行初始化處理,即,初始化 學(xué)習(xí)是在學(xué)習(xí)過程開始前,根據(jù)機(jī)器人過往的經(jīng)驗,加載相關(guān)的信息塊到注意焦點(diǎn)中。具體 過程是從表征當(dāng)前感知和目標(biāo)狀態(tài)(僅用于認(rèn)知層學(xué)習(xí))的信息塊開始,依次加載與之有直 接或間接化化ian關(guān)系的其他信息塊,優(yōu)先考慮有直接關(guān)聯(lián)且置信度較高的信息塊;所述信 息整理單元通過利用遺忘機(jī)制和泛化機(jī)制對所述信息存儲模塊中的信息塊進(jìn)行整理,即, 信息整理包含遺忘和泛化兩種機(jī)制:通過定期修剪置信度接近0的關(guān)系,即模擬人的遺忘機(jī) 審IJ,去除信息塊之間冗余的連接,提高系統(tǒng)運(yùn)行效率;通過聚類算法,從已有的知識中抽象 出新的概念,泛化機(jī)器人已有的知識和能力,W應(yīng)對其他相近的任務(wù)需求(模擬人舉一反Ξ 的能力)。并且,所述信息存儲模塊中設(shè)有用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息的注意焦點(diǎn) 存儲單元,在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前,所述初始化學(xué)習(xí)單元加載與當(dāng)前任務(wù)緊密關(guān) 聯(lián)的信息塊到所述注意焦點(diǎn)存儲單元中。
[0035] 所述輸入輸出模塊進(jìn)一步包括感知器和執(zhí)行器,所述感知器用于采集信息并將采 集到的信息保存至所述信息存儲模塊中,所述執(zhí)行器用于根據(jù)所述行為模式執(zhí)行所述控制 模塊交付的任務(wù)。具體的,感知器將采集到的數(shù)據(jù),經(jīng)去噪、特征抽取、符號化等操作后,保 存到信息存儲模塊中,交由控制模塊處理;執(zhí)行器執(zhí)行信息存儲模塊中保存的,由控制模塊 規(guī)劃好的各種操作。輸入輸出模塊負(fù)責(zé)機(jī)器人與外部環(huán)境交互的直接交互。運(yùn)里的外部環(huán) 境依機(jī)器人各類的不同而定,例如對于虛擬機(jī)器人,其外部環(huán)境就是機(jī)器人所處的虛擬環(huán) 境,而不是真實的環(huán)境。
[0036] 本發(fā)明的仿腦機(jī)器人,其信息存儲模塊采用基于廣義圖的知識表示和存儲方式, 通過統(tǒng)一的信息存儲模塊,實現(xiàn)系統(tǒng)各模塊高度松禪合的關(guān)聯(lián)??刂颇K又細(xì)分為Ξ層,分 別模擬人類不同層次的認(rèn)知和學(xué)習(xí)能力:反應(yīng)層,模擬人類快速的、本能的反應(yīng);認(rèn)知層,模 擬人類的一般認(rèn)知能力,包括注意機(jī)制、動作規(guī)劃和強(qiáng)化學(xué)習(xí)過程;元認(rèn)知層,模擬人類抽 象的元認(rèn)知能力,包括產(chǎn)生新的行為模式、初始化學(xué)習(xí)、信息整理,W及性能監(jiān)視。輸入輸出 模塊中的感知器和執(zhí)行器則負(fù)責(zé)與外部環(huán)境的直接交互。該系統(tǒng)能夠讓機(jī)器人在僅有少量 預(yù)設(shè)知識和預(yù)定義行為的條件下啟動,通過與用戶的不斷交互,自主學(xué)習(xí),自適應(yīng)不同的應(yīng) 用場景,W及不同用戶的個性化需求。本發(fā)明尤其適用于服務(wù)機(jī)器人,包括各類實體機(jī)器人 (如咨詢機(jī)器人、送餐機(jī)器人、娛樂機(jī)器人、教育機(jī)器人、陪伴機(jī)器人、醫(yī)療機(jī)器人)和虛擬機(jī) 器人(如聊天機(jī)器人軟件)。
[0037] 本發(fā)明主要特點(diǎn)概括如下:
[0038] 1.統(tǒng)一信息存儲:包含機(jī)器人感知、動作在內(nèi)的全部知識都采用統(tǒng)一的知識表示, 為協(xié)調(diào)系統(tǒng)各模塊,W及融合不同的學(xué)習(xí)機(jī)制打下基礎(chǔ)。整個信息存儲模塊包含許多信息 塊,每個信息塊又通過遞歸的方式定義,信息塊之間相互關(guān)聯(lián)形成廣義圖的結(jié)構(gòu)。每個信息 塊內(nèi)還定義了置信度,可靈活運(yùn)用于各類設(shè)及概率的控制和學(xué)習(xí)算法。
[0039] 2.高度松禪合:系統(tǒng)各模塊只與中央存儲的統(tǒng)一的信息存儲模塊直接關(guān)聯(lián),通過 分別向信息存儲模塊讀、寫信息,間接交換數(shù)據(jù)。不同模塊先是將讀、寫請求發(fā)送到消息隊 列,然而再由信息存儲模塊異步處理消息隊列中的讀、寫請求。注意焦點(diǎn)存儲的是與當(dāng)前任 務(wù)緊密相關(guān)的數(shù)據(jù),與當(dāng)前任務(wù)沒有明顯相關(guān)的數(shù)據(jù)存放在本地存儲中,歷史數(shù)據(jù)則備份 在云存儲中。將系統(tǒng)模塊之間多對多的關(guān)系,簡化為多對一的關(guān)系。系統(tǒng)各模塊可W根據(jù)需 要,靈活運(yùn)用不同的算法,采用最適合的實現(xiàn)方式。
[0040] 3.分層認(rèn)知模型:控制模塊采用反應(yīng)層、認(rèn)知層和元認(rèn)知層的Ξ層架構(gòu)。每個層次 各自采用不同的控制與學(xué)習(xí)算法,分別模擬人類的本能反應(yīng)、一般認(rèn)知,W及元認(rèn)知能力。 各層之間相對獨(dú)立運(yùn)作,但又通過統(tǒng)一的信息存儲模塊相互關(guān)聯(lián)。例如,認(rèn)知層中的強(qiáng)化學(xué) 習(xí)過程,其基礎(chǔ)是反應(yīng)層中學(xué)習(xí)到的化化ian關(guān)系,而其學(xué)習(xí)前的初始化、學(xué)習(xí)過程中的資 源分配和參數(shù)調(diào)節(jié),包括學(xué)習(xí)后的信息存儲模塊整理,又受到元認(rèn)知層的調(diào)控。
[0041] 需要說明的是,本說明書中的各個實施例均采用遞進(jìn)的方式描述,每個實施例重 點(diǎn)說明的都是與其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
[0042] 并且,在本文中,術(shù)語"包括"、"包含"或者其任何其他變體意在涵蓋非排他性的包 含,從而使得包括一系列要素的過程、系統(tǒng)、物品或者設(shè)備不僅包括那些要素,而且還包括 沒有明確列出的其他要素,或者是還包括為運(yùn)種過程、系統(tǒng)、物品或者設(shè)備所固有的要素。 在沒有更多限制的情況下,由語句"包括一個……"限定的要素,并不排除在包括所述要素 的過程、系統(tǒng)、物品或者設(shè)備中還存在另外的相同要素。另外,本領(lǐng)域普通技術(shù)人員可W理 解實現(xiàn)上述實施例的全部或部分步驟可W通過硬件來完成,也可W通過程序來指令相關(guān)的 硬件完成,所述的程序可W存儲于一種計算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可W 是只讀存儲器,磁盤或光盤等。
[0043]上述說明示出并描述了本發(fā)明的優(yōu)選實施例,應(yīng)當(dāng)理解本發(fā)明并非局限于本文所 披露的形式,不應(yīng)看作是對其他實施例的排除,而可用于各種其他組合、修改和環(huán)境,并能 夠在本文發(fā)明構(gòu)想范圍內(nèi),通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識進(jìn)行改動。而本領(lǐng)域人 員所進(jìn)行的改動和變化不脫離本發(fā)明的精神和范圍,則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù) 范圍內(nèi)。
【主權(quán)項】
1. 一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于,包括輸入輸出模塊、信息存儲模塊、 控制模塊,所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中,所述控制模塊 通過調(diào)用所述信息存儲模塊中的信息進(jìn)行生成行為模式,并將該行為模式傳送至所述輸入 輸出模塊,所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù);其中,所述控制模塊進(jìn)一步包 括以下三層架構(gòu):反應(yīng)層、認(rèn)知層、元認(rèn)知層,所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊 組成,且各個信息塊之間通過遞歸方式進(jìn)行定義;所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所 述信息存儲模塊連接,所述反應(yīng)層通過所述信息塊之間的Hebbian學(xué)習(xí)進(jìn)行模擬人腦的快 速的、本能的反應(yīng),所述認(rèn)知層對所述反應(yīng)層的學(xué)習(xí)結(jié)果進(jìn)一步運(yùn)用強(qiáng)化學(xué)習(xí)算法進(jìn)行模 擬行為學(xué)習(xí)中反復(fù)試錯的認(rèn)知過程,所述元認(rèn)知層根據(jù)所述認(rèn)知層的學(xué)習(xí)結(jié)果形成新的行 為模式。2. 根據(jù)權(quán)利要求1所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于:所述信息存儲 模塊進(jìn)一步包括注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單元,其中,所述注意焦點(diǎn)存儲 單元用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息,所述云存儲單元用于備份歷史信息。3. 根據(jù)權(quán)利要求2所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于:所述信息存儲 模塊中的信息塊是采用基于廣義圖的知識表示方式和存儲方式,所述信息塊位于所述廣義 圖中的頂點(diǎn)或邊,且所述信息塊之間還可以嵌套組合形成新的信息塊。4. 根據(jù)權(quán)利要求1所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于:所述輸入輸出 模塊進(jìn)一步包括感知器和執(zhí)行器,所述感知器用于采集信息并將采集到的信息保存至所述 信息存儲模塊中,所述執(zhí)行器用于根據(jù)所述行為模式執(zhí)行所述控制模塊交付的任務(wù)。5. 根據(jù)權(quán)利要求1至4任一項所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于:所 述信息塊中還定義了Hebbian關(guān)系的置信度,當(dāng)置信度小于預(yù)設(shè)閾值時,則刪除對應(yīng)的 Hebbian 關(guān)系。6. 根據(jù)權(quán)利要求1至4任一項所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于:所 述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào)節(jié)單元、初始化學(xué)習(xí)單元、信息整理單元,其 中,所述系統(tǒng)監(jiān)控單元用于監(jiān)控系統(tǒng)的各個模塊和過程的資源使用情況,所述參數(shù)調(diào)節(jié)單 元根據(jù)所述系統(tǒng)監(jiān)控單元提供的資源使用情況進(jìn)行分配和調(diào)節(jié)系統(tǒng)資源,所述初始化學(xué)習(xí) 單元用于在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前進(jìn)行初始化處理,所述信息整理單元通過利用遺 忘機(jī)制和泛化機(jī)制對所述信息存儲模塊中的信息塊進(jìn)行整理。7. 根據(jù)權(quán)利要求6所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng),其特征在于:所述信息存儲 模塊中設(shè)有用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息的注意焦點(diǎn)存儲單元,在所述認(rèn)知層進(jìn)行 強(qiáng)化學(xué)習(xí)之前,所述初始化學(xué)習(xí)單元加載與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息塊到所述注意焦點(diǎn)存 儲單元中。
【文檔編號】G06N3/08GK105936047SQ201610527486
【公開日】2016年9月14日
【申請日】2016年7月6日
【發(fā)明人】蔡振華, 李稀敏, 肖龍源, 朱敬華, 劉楚, 譚玉坤
【申請人】廈門快商通科技股份有限公司