仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)的制作方法

文檔序號：10575061閱讀：471來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>五金工具產(chǎn)品及配附件制造技術(shù)

仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其包括輸入輸出模塊、信息存儲模塊、控制模塊，所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中，所述控制模塊通過調(diào)用所述信息存儲模塊中的信息進(jìn)行生成行為模式，所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù)；其中，所述控制模塊進(jìn)一步包括以下三層架構(gòu)：反應(yīng)層、認(rèn)知層、元認(rèn)知層，所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成，且各個信息塊之間通過遞歸方式進(jìn)行定義；所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所述信息存儲模塊連接；能夠讓機(jī)器人在僅有少量預(yù)設(shè)知識和預(yù)定義行為的條件下啟動，通過與用戶的不斷交互來強(qiáng)化自身的執(zhí)行能力，自適應(yīng)不同的應(yīng)用場景，滿足不同用戶的個性化需求。
【專利說明】
仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及人工智能技術(shù)領(lǐng)域，特別是一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)。
【背景技術(shù)】
[0002] 機(jī)器人技術(shù)作為20世紀(jì)人類最偉大的發(fā)明之一，自60年代初問世W來，經(jīng)歷40年的發(fā)展已取得長足的進(jìn)步。工業(yè)機(jī)器人在經(jīng)歷了誕生、成長、成熟期后，已成為制造業(yè)中不可少的核屯、裝備。特種機(jī)器人作為機(jī)器人家族的后起之秀，由于其用途廣泛而大有后來居上之勢，仿人形機(jī)器人、農(nóng)業(yè)機(jī)器人、服務(wù)機(jī)器人、水下機(jī)器人、醫(yī)療機(jī)器人、軍用機(jī)器人、娛樂機(jī)器人等各種用途的特種機(jī)器人紛紛面世，而且正W飛快的速度向?qū)嵱没~進(jìn)。
[0003] 但是，現(xiàn)有技術(shù)中對機(jī)器人的研究大多局限于模仿人類的動作語言、人體造型、人造肌肉、人造皮膚等，例如模仿人類的步行、發(fā)聲、表情、運(yùn)動等，制造各種美女機(jī)器人等，但運(yùn)些機(jī)器人一般是為了解決某一特定問題而設(shè)計的，只能根據(jù)預(yù)設(shè)的工作場景來執(zhí)行對應(yīng) 的任務(wù)，需要大量的預(yù)先編程和設(shè)置，缺乏一個統(tǒng)一的框架來模擬人的認(rèn)知能力，用戶購買機(jī)器人后，如果沒有二次開發(fā)的能力，便難W教會機(jī)器人處理新的任務(wù)，無法做到像人一樣自主學(xué)習(xí)、快速適應(yīng)不同的環(huán)境，適用范圍受到極大的限制。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明為解決上述問題，提供了一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，能夠模仿人腦的自主學(xué)習(xí)過程，自適應(yīng)不同的應(yīng)用場景，滿足不同用戶的個性化需求。
[0005] 為實現(xiàn)上述目的，本發(fā)明采用的技術(shù)方案為：
[0006] -種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其包括輸入輸出模塊、信息存儲模塊、控制模塊，所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中，所述控制模塊通過調(diào) 用所述信息存儲模塊中的信息進(jìn)行生成行為模式，并將該行為模式傳送至所述輸入輸出模塊，所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù);其中，所述控制模塊進(jìn)一步包括W下 Ξ層架構(gòu):反應(yīng)層、認(rèn)知層、元認(rèn)知層，所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成，且各個信息塊之間通過遞歸方式進(jìn)行定義;所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所述信息存儲模塊連接，所述反應(yīng)層通過所述信息塊之間的化化ian學(xué)習(xí)進(jìn)行模擬人腦的快速的、本能的反應(yīng)，所述認(rèn)知層對所述反應(yīng)層的學(xué)習(xí)結(jié)果進(jìn)一步運(yùn)用強(qiáng)化學(xué)習(xí)算法進(jìn)行模擬行為學(xué)習(xí) 中反復(fù)試錯的認(rèn)知過程，所述元認(rèn)知層根據(jù)所述認(rèn)知層的學(xué)習(xí)結(jié)果形成新的行為模式。
[0007] 優(yōu)選的，所述信息存儲模塊進(jìn)一步包括注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單元，其中，所述注意焦點(diǎn)存儲單元用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息，所述云存儲單元用于備份歷史信息。
[000引優(yōu)選的，所述信息存儲模塊中的信息塊是采用基于廣義圖的知識表示方式和存儲方式，所述信息塊位于所述廣義圖中的頂點(diǎn)或邊，且所述信息塊之間還可W嵌套組合形成新的信息塊。
[0009]優(yōu)選的，所述輸入輸出模塊進(jìn)一步包括感知器和執(zhí)行器，所述感知器用于采集信息并將采集到的信息保存至所述信息存儲模塊中，所述執(zhí)行器用于根據(jù)所述行為模式執(zhí)行所述控制模塊交付的任務(wù)。
[0010] 優(yōu)選的，所述信息塊中還定義了化化ian關(guān)系的置信度，當(dāng)置信度小于預(yù)設(shè)闊值時，則刪除對應(yīng)的化化ian關(guān)系。
[0011] 優(yōu)選的，所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào)節(jié)單元、初始化學(xué)習(xí)單元、信息整理單元，其中，所述系統(tǒng)監(jiān)控單元用于監(jiān)控系統(tǒng)的各個模塊和過程的資源使用情況，所述參數(shù)調(diào)節(jié)單元根據(jù)所述系統(tǒng)監(jiān)控單元提供的資源使用情況進(jìn)行分配和調(diào)節(jié)系統(tǒng)資源，所述初始化學(xué)習(xí)單元用于在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前進(jìn)行初始化處理，所述信息整理單元通過利用遺忘機(jī)制和泛化機(jī)制對所述信息存儲模塊中的信息塊進(jìn)行整理。
[0012] 優(yōu)選的，所述信息存儲模塊中設(shè)有用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息的注意焦點(diǎn)存儲單元，在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前，所述初始化學(xué)習(xí)單元加載與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息塊到所述注意焦點(diǎn)存儲單元中。
[0013] 本發(fā)明的有益效果是：
[0014] (1)、本發(fā)明通過采用由反應(yīng)層、認(rèn)知層、元認(rèn)知層的Ξ層架構(gòu)的控制器實現(xiàn)自主學(xué)習(xí)功能，能夠讓機(jī)器人在僅有少量預(yù)設(shè)知識和預(yù)定義行為的條件下啟動，通過與用戶的不斷交互來強(qiáng)化自身的執(zhí)行能力，自適應(yīng)不同的應(yīng)用場景，滿足不同用戶的個性化需求；
[0015] (2)、所述信息存儲模塊進(jìn)一步分為注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單元，僅將與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息存儲于所述注意焦點(diǎn)存儲單元，提高機(jī)器人的運(yùn)算速度和工作效率；
[0016] (3)、所述信息塊中還定義了化化ian關(guān)系的置信度，當(dāng)置信度小于預(yù)設(shè)闊值時，貝U 刪除對應(yīng)的化化ian關(guān)系，從而簡化所述信息存儲模塊中的信息結(jié)構(gòu)，僅保留有用的信息，能夠進(jìn)一步提高機(jī)器人的運(yùn)算速度；
[0017] (4)、所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào)節(jié)單元、初始化學(xué)習(xí)單元、信息整理單元，能夠模擬人腦的抽象能力實現(xiàn)對系統(tǒng)的各個模塊的宏觀調(diào)控；
[0018] (5)、所述控制模塊的反應(yīng)層、認(rèn)知層、元認(rèn)知層分別單獨(dú)與所述信息存儲模塊連接，系統(tǒng)各模塊各自向所述信息存儲模塊進(jìn)行讀、寫信息，實現(xiàn)高度松禪合的關(guān)聯(lián)，從而使得各個模塊能夠各自使用不同的算法，控制更靈活更方便。
【附圖說明】
[0019] 此處所說明的附圖用來提供對本發(fā)明的進(jìn)一步理解，構(gòu)成本發(fā)明的一部分，本發(fā) 明的示意性實施例及其說明用于解釋本發(fā)明，并不構(gòu)成對本發(fā)明的不當(dāng)限定。在附圖中：
[0020] 圖1為本發(fā)明一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)的整體結(jié)構(gòu)示意圖；
[0021] 圖2本發(fā)明的信息塊的結(jié)構(gòu)關(guān)系示意圖；
[0022] 圖3為圖1中的反應(yīng)層的化化ian學(xué)習(xí)示例圖；
[0023] 圖4為圖1中的認(rèn)知層的強(qiáng)化學(xué)習(xí)示例圖。
[0024] 圖5為圖1中的元認(rèn)知層的結(jié)構(gòu)示意圖。
【具體實施方式】
[0025] 為了使本發(fā)明所要解決的技術(shù)問題、技術(shù)方案及有益效果更加清楚、明白，W下結(jié) 合附圖及實施例對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解，此處所描述的具體實施例僅用 W解釋本發(fā)明，并不用于限定本發(fā)明。
[0026] 本發(fā)明設(shè)及仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，尤其指一種模擬人類屯、理認(rèn)知過程，能夠自主學(xué)習(xí)與調(diào)控的機(jī)器人系統(tǒng)。本發(fā)明由信息存儲模塊、控制模塊，W及輸入輸出模塊Ξ 大模塊構(gòu)成。
[0027] 如圖1所示，本發(fā)明的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其包括輸入輸出模塊、信息存儲模塊、控制模塊，所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中，所述控制模塊通過調(diào)用所述信息存儲模塊中的信息進(jìn)行生成行為模式，并將該行為模式傳送至所述輸入輸出模塊，所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù)。
[0028] 所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成，且各個信息塊之間通過遞歸方式進(jìn)行定義;所述信息存儲模塊進(jìn)一步包括注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單元，其中，所述注意焦點(diǎn)存儲單元用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息，所述云存儲單元用于備份歷史信息，另外，本地存儲單元則是用于存儲與當(dāng)前任務(wù)較無關(guān)聯(lián)的其他信息。所述信息存儲模塊中的信息塊是采用基于廣義圖的知識表示方式和存儲方式，所述信息塊位于所述廣義圖中的頂點(diǎn)或邊，且所述信息塊之間還可W嵌套組合形成新的信息塊(如圖2所示）。所述信息塊中還定義了化化ian關(guān)系的置信度，當(dāng)置信度小于預(yù)設(shè)闊值時，則刪除對應(yīng) 的化化i an關(guān)系。
[0029] 如圖2所示，本實施例中，所示信息塊是通過如下的遞歸方式進(jìn)行定義的：每個信息塊Μ是一個由（I，R，0，C)構(gòu)成的四元組，表示從I到0,具有關(guān)系R，置信度為C，其中I，R，0各自又可W是一個信息塊。最基本的信息塊是I和0均為空集的信息塊，即（0，R，0.C)。例如：圖2表示從巧化有關(guān)系R，置信度為0.89,而I和0各自又都是信息塊。I表示從B到C有關(guān)系A(chǔ)，置信度為0.35，從D到F有關(guān)系E，置信度為0.74。
[0030] 所述控制模塊進(jìn)一步包括W下Ξ層架構(gòu)：反應(yīng)層（如圖3所示）、認(rèn)知層（如圖4所示）、元認(rèn)知層(如圖5所示），各自模擬人類某一方面的屯、理認(rèn)知能力。所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所述信息存儲模塊連接，所述反應(yīng)層通過所述信息塊之間的化化ian學(xué)習(xí) 進(jìn)行模擬人腦的快速的、本能的反應(yīng)，所述認(rèn)知層對所述反應(yīng)層的學(xué)習(xí)結(jié)果進(jìn)一步運(yùn)用強(qiáng) 化學(xué)習(xí)算法進(jìn)行模擬行為學(xué)習(xí)中反復(fù)試錯的認(rèn)知過程，所述元認(rèn)知層根據(jù)所述認(rèn)知層的學(xué) 習(xí)結(jié)果形成新的行為模式，該元認(rèn)知層還負(fù)責(zé)監(jiān)控系統(tǒng)各模塊的運(yùn)行情況，再通過參數(shù)調(diào) 節(jié)為各模塊分配系統(tǒng)資源，W及學(xué)習(xí)前的初始化和學(xué)習(xí)后的信息存儲模塊整理，通過遺忘和泛化兩種機(jī)制提高系統(tǒng)運(yùn)行效率和機(jī)器人的適應(yīng)性。。
[0031] 如圖3所示的反應(yīng)層中的化化ian學(xué)習(xí)示例。反應(yīng)層中的學(xué)習(xí)過程模擬的是生物神經(jīng)元之間的化化ian學(xué)習(xí)。具體實施方法是:每隔一個學(xué)習(xí)時間間隔T，先對注意焦點(diǎn)中的信息塊，按照它們進(jìn)入注意焦點(diǎn)的時間先后順序進(jìn)行排序。然后，根據(jù)下表所示的規(guī)則，更新、添加或刪除相鄰兩個信息塊之間的化化ian關(guān)系。
[0032]
[0033] 如圖4所示的認(rèn)知層中的強(qiáng)化學(xué)習(xí)示例。認(rèn)知層中進(jìn)行的強(qiáng)化學(xué)習(xí)過程模擬的是行為學(xué)習(xí)中反復(fù)試錯的過程。具體實施采用的是強(qiáng)化學(xué)習(xí)中的Q學(xué)習(xí)算法。Q學(xué)習(xí)需要的狀態(tài)集合S和動作集合A，通過反應(yīng)層中的化化ian關(guān)系得到。例如：圖4表示狀態(tài)集合S= {SO, 51，52,53}，在動作集合4=^1，42,43,44,45,46,47,48}下的狀態(tài)轉(zhuǎn)換關(guān)系。信息塊之間的連線表示化化ian關(guān)系（為保持簡潔，圖4中省略了表示化化ian關(guān)系的信息塊）?；痠an關(guān) 系中的置信度表示相應(yīng)狀態(tài)轉(zhuǎn)換的概率，或者執(zhí)行某個動作后達(dá)成某個狀態(tài)的概率。
[0034] 如圖5所示的元認(rèn)知層的具體設(shè)計方案。元認(rèn)知層模擬的是人的抽象認(rèn)知能力，與機(jī)器人執(zhí)行的具體任務(wù)無關(guān)。本實施例中，所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào) 節(jié)單元、初始化學(xué)習(xí)單元、信息整理單元，其中，所述系統(tǒng)監(jiān)控單元用于監(jiān)控系統(tǒng)的各個模塊和過程的資源使用情況，包括CPU、內(nèi)存、存儲容量，W及網(wǎng)絡(luò)請求;所述參數(shù)調(diào)節(jié)單元根據(jù)所述系統(tǒng)監(jiān)控單元提供的資源使用情況進(jìn)行分配和調(diào)節(jié)系統(tǒng)資源，根據(jù)當(dāng)前系統(tǒng)狀態(tài)W 及任務(wù)需求，為各模塊和過程分配系統(tǒng)資源，調(diào)控感知器、執(zhí)行器W及學(xué)習(xí)過程的具體執(zhí) 行;所述初始化學(xué)習(xí)單元用于在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前進(jìn)行初始化處理，即，初始化學(xué)習(xí)是在學(xué)習(xí)過程開始前，根據(jù)機(jī)器人過往的經(jīng)驗，加載相關(guān)的信息塊到注意焦點(diǎn)中。具體過程是從表征當(dāng)前感知和目標(biāo)狀態(tài)(僅用于認(rèn)知層學(xué)習(xí)）的信息塊開始，依次加載與之有直接或間接化化ian關(guān)系的其他信息塊，優(yōu)先考慮有直接關(guān)聯(lián)且置信度較高的信息塊;所述信息整理單元通過利用遺忘機(jī)制和泛化機(jī)制對所述信息存儲模塊中的信息塊進(jìn)行整理，即，信息整理包含遺忘和泛化兩種機(jī)制:通過定期修剪置信度接近0的關(guān)系，即模擬人的遺忘機(jī) 審IJ，去除信息塊之間冗余的連接，提高系統(tǒng)運(yùn)行效率;通過聚類算法，從已有的知識中抽象出新的概念，泛化機(jī)器人已有的知識和能力，W應(yīng)對其他相近的任務(wù)需求(模擬人舉一反Ξ 的能力）。并且，所述信息存儲模塊中設(shè)有用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息的注意焦點(diǎn) 存儲單元，在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前，所述初始化學(xué)習(xí)單元加載與當(dāng)前任務(wù)緊密關(guān) 聯(lián)的信息塊到所述注意焦點(diǎn)存儲單元中。
[0035] 所述輸入輸出模塊進(jìn)一步包括感知器和執(zhí)行器，所述感知器用于采集信息并將采集到的信息保存至所述信息存儲模塊中，所述執(zhí)行器用于根據(jù)所述行為模式執(zhí)行所述控制模塊交付的任務(wù)。具體的，感知器將采集到的數(shù)據(jù)，經(jīng)去噪、特征抽取、符號化等操作后，保存到信息存儲模塊中，交由控制模塊處理;執(zhí)行器執(zhí)行信息存儲模塊中保存的，由控制模塊規(guī)劃好的各種操作。輸入輸出模塊負(fù)責(zé)機(jī)器人與外部環(huán)境交互的直接交互。運(yùn)里的外部環(huán) 境依機(jī)器人各類的不同而定，例如對于虛擬機(jī)器人，其外部環(huán)境就是機(jī)器人所處的虛擬環(huán) 境，而不是真實的環(huán)境。
[0036] 本發(fā)明的仿腦機(jī)器人，其信息存儲模塊采用基于廣義圖的知識表示和存儲方式，通過統(tǒng)一的信息存儲模塊，實現(xiàn)系統(tǒng)各模塊高度松禪合的關(guān)聯(lián)?？刂颇K又細(xì)分為Ξ層，分別模擬人類不同層次的認(rèn)知和學(xué)習(xí)能力:反應(yīng)層，模擬人類快速的、本能的反應(yīng);認(rèn)知層，模擬人類的一般認(rèn)知能力，包括注意機(jī)制、動作規(guī)劃和強(qiáng)化學(xué)習(xí)過程;元認(rèn)知層，模擬人類抽象的元認(rèn)知能力，包括產(chǎn)生新的行為模式、初始化學(xué)習(xí)、信息整理，W及性能監(jiān)視。輸入輸出模塊中的感知器和執(zhí)行器則負(fù)責(zé)與外部環(huán)境的直接交互。該系統(tǒng)能夠讓機(jī)器人在僅有少量預(yù)設(shè)知識和預(yù)定義行為的條件下啟動，通過與用戶的不斷交互，自主學(xué)習(xí)，自適應(yīng)不同的應(yīng) 用場景，W及不同用戶的個性化需求。本發(fā)明尤其適用于服務(wù)機(jī)器人，包括各類實體機(jī)器人 (如咨詢機(jī)器人、送餐機(jī)器人、娛樂機(jī)器人、教育機(jī)器人、陪伴機(jī)器人、醫(yī)療機(jī)器人)和虛擬機(jī) 器人(如聊天機(jī)器人軟件）。
[0037] 本發(fā)明主要特點(diǎn)概括如下：
[0038] 1.統(tǒng)一信息存儲:包含機(jī)器人感知、動作在內(nèi)的全部知識都采用統(tǒng)一的知識表示，為協(xié)調(diào)系統(tǒng)各模塊，W及融合不同的學(xué)習(xí)機(jī)制打下基礎(chǔ)。整個信息存儲模塊包含許多信息塊，每個信息塊又通過遞歸的方式定義，信息塊之間相互關(guān)聯(lián)形成廣義圖的結(jié)構(gòu)。每個信息塊內(nèi)還定義了置信度，可靈活運(yùn)用于各類設(shè)及概率的控制和學(xué)習(xí)算法。
[0039] 2.高度松禪合：系統(tǒng)各模塊只與中央存儲的統(tǒng)一的信息存儲模塊直接關(guān)聯(lián)，通過分別向信息存儲模塊讀、寫信息，間接交換數(shù)據(jù)。不同模塊先是將讀、寫請求發(fā)送到消息隊列，然而再由信息存儲模塊異步處理消息隊列中的讀、寫請求。注意焦點(diǎn)存儲的是與當(dāng)前任務(wù)緊密相關(guān)的數(shù)據(jù)，與當(dāng)前任務(wù)沒有明顯相關(guān)的數(shù)據(jù)存放在本地存儲中，歷史數(shù)據(jù)則備份在云存儲中。將系統(tǒng)模塊之間多對多的關(guān)系，簡化為多對一的關(guān)系。系統(tǒng)各模塊可W根據(jù)需要，靈活運(yùn)用不同的算法，采用最適合的實現(xiàn)方式。
[0040] 3.分層認(rèn)知模型:控制模塊采用反應(yīng)層、認(rèn)知層和元認(rèn)知層的Ξ層架構(gòu)。每個層次各自采用不同的控制與學(xué)習(xí)算法，分別模擬人類的本能反應(yīng)、一般認(rèn)知，W及元認(rèn)知能力。各層之間相對獨(dú)立運(yùn)作，但又通過統(tǒng)一的信息存儲模塊相互關(guān)聯(lián)。例如，認(rèn)知層中的強(qiáng)化學(xué) 習(xí)過程，其基礎(chǔ)是反應(yīng)層中學(xué)習(xí)到的化化ian關(guān)系，而其學(xué)習(xí)前的初始化、學(xué)習(xí)過程中的資源分配和參數(shù)調(diào)節(jié)，包括學(xué)習(xí)后的信息存儲模塊整理，又受到元認(rèn)知層的調(diào)控。
[0041] 需要說明的是，本說明書中的各個實施例均采用遞進(jìn)的方式描述，每個實施例重點(diǎn)說明的都是與其他實施例的不同之處，各個實施例之間相同相似的部分互相參見即可。
[0042] 并且，在本文中，術(shù)語"包括"、"包含"或者其任何其他變體意在涵蓋非排他性的包含，從而使得包括一系列要素的過程、系統(tǒng)、物品或者設(shè)備不僅包括那些要素，而且還包括沒有明確列出的其他要素，或者是還包括為運(yùn)種過程、系統(tǒng)、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下，由語句"包括一個……"限定的要素，并不排除在包括所述要素的過程、系統(tǒng)、物品或者設(shè)備中還存在另外的相同要素。另外，本領(lǐng)域普通技術(shù)人員可W理解實現(xiàn)上述實施例的全部或部分步驟可W通過硬件來完成，也可W通過程序來指令相關(guān)的硬件完成，所述的程序可W存儲于一種計算機(jī)可讀存儲介質(zhì)中，上述提到的存儲介質(zhì)可W 是只讀存儲器，磁盤或光盤等。
[0043]上述說明示出并描述了本發(fā)明的優(yōu)選實施例，應(yīng)當(dāng)理解本發(fā)明并非局限于本文所披露的形式，不應(yīng)看作是對其他實施例的排除，而可用于各種其他組合、修改和環(huán)境，并能夠在本文發(fā)明構(gòu)想范圍內(nèi)，通過上述教導(dǎo)或相關(guān)領(lǐng)域的技術(shù)或知識進(jìn)行改動。而本領(lǐng)域人員所進(jìn)行的改動和變化不脫離本發(fā)明的精神和范圍，則都應(yīng)在本發(fā)明所附權(quán)利要求的保護(hù) 范圍內(nèi)。
【主權(quán)項】
1. 一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于，包括輸入輸出模塊、信息存儲模塊、控制模塊，所述輸入輸出模塊將采集到的信息保存至所述信息存儲模塊中，所述控制模塊通過調(diào)用所述信息存儲模塊中的信息進(jìn)行生成行為模式，并將該行為模式傳送至所述輸入輸出模塊，所述輸入輸出模塊根據(jù)該行為模式進(jìn)行執(zhí)行任務(wù);其中，所述控制模塊進(jìn)一步包括以下三層架構(gòu):反應(yīng)層、認(rèn)知層、元認(rèn)知層，所述信息存儲模塊由許多相互關(guān)聯(lián)的信息塊組成，且各個信息塊之間通過遞歸方式進(jìn)行定義;所述反應(yīng)層、認(rèn)知層、元認(rèn)知層分別與所述信息存儲模塊連接，所述反應(yīng)層通過所述信息塊之間的Hebbian學(xué)習(xí)進(jìn)行模擬人腦的快速的、本能的反應(yīng)，所述認(rèn)知層對所述反應(yīng)層的學(xué)習(xí)結(jié)果進(jìn)一步運(yùn)用強(qiáng)化學(xué)習(xí)算法進(jìn)行模擬行為學(xué)習(xí)中反復(fù)試錯的認(rèn)知過程，所述元認(rèn)知層根據(jù)所述認(rèn)知層的學(xué)習(xí)結(jié)果形成新的行為模式。2. 根據(jù)權(quán)利要求1所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于:所述信息存儲模塊進(jìn)一步包括注意焦點(diǎn)存儲單元、本地存儲單元、云存儲單元，其中，所述注意焦點(diǎn)存儲單元用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息，所述云存儲單元用于備份歷史信息。3. 根據(jù)權(quán)利要求2所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于:所述信息存儲模塊中的信息塊是采用基于廣義圖的知識表示方式和存儲方式，所述信息塊位于所述廣義圖中的頂點(diǎn)或邊，且所述信息塊之間還可以嵌套組合形成新的信息塊。4. 根據(jù)權(quán)利要求1所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于:所述輸入輸出模塊進(jìn)一步包括感知器和執(zhí)行器，所述感知器用于采集信息并將采集到的信息保存至所述信息存儲模塊中，所述執(zhí)行器用于根據(jù)所述行為模式執(zhí)行所述控制模塊交付的任務(wù)。5. 根據(jù)權(quán)利要求1至4任一項所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于:所述信息塊中還定義了Hebbian關(guān)系的置信度，當(dāng)置信度小于預(yù)設(shè)閾值時，則刪除對應(yīng)的 Hebbian 關(guān)系。6. 根據(jù)權(quán)利要求1至4任一項所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于:所述元認(rèn)知層進(jìn)一步包括系統(tǒng)監(jiān)控單元、參數(shù)調(diào)節(jié)單元、初始化學(xué)習(xí)單元、信息整理單元，其中，所述系統(tǒng)監(jiān)控單元用于監(jiān)控系統(tǒng)的各個模塊和過程的資源使用情況，所述參數(shù)調(diào)節(jié)單元根據(jù)所述系統(tǒng)監(jiān)控單元提供的資源使用情況進(jìn)行分配和調(diào)節(jié)系統(tǒng)資源，所述初始化學(xué)習(xí) 單元用于在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前進(jìn)行初始化處理，所述信息整理單元通過利用遺忘機(jī)制和泛化機(jī)制對所述信息存儲模塊中的信息塊進(jìn)行整理。7. 根據(jù)權(quán)利要求6所述的一種仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)，其特征在于:所述信息存儲模塊中設(shè)有用于存儲與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息的注意焦點(diǎn)存儲單元，在所述認(rèn)知層進(jìn)行強(qiáng)化學(xué)習(xí)之前，所述初始化學(xué)習(xí)單元加載與當(dāng)前任務(wù)緊密關(guān)聯(lián)的信息塊到所述注意焦點(diǎn)存儲單元中。
【文檔編號】G06N3/08GK105936047SQ201610527486
【公開日】2016年9月14日
【申請日】2016年7月6日
【發(fā)明人】蔡振華, 李稀敏, 肖龍源, 朱敬華, 劉楚, 譚玉坤
【申請人】廈門快商通科技股份有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：蔡振華;李稀敏;肖龍源;朱敬華;劉楚;譚玉坤;
技術(shù)所有人：廈門快商通科技股份有限公司;
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、平老師：1.功能涂層設(shè)計與應(yīng)用 2.柔性電子器件設(shè)計與應(yīng)用 3.結(jié)構(gòu)動態(tài)參數(shù)測試與裝置研發(fā) 4.智能機(jī)電一體化產(chǎn)品研發(fā) 5.3D打印工藝與設(shè)備
2、潘老師：1.機(jī)電一體化裝備及其控制技術(shù) 2.多傳感器信息融合與質(zhì)量評定
3、王老師：機(jī)械制造
4、袁老師：1.薄膜氣敏傳感器 2.薄膜太陽能電池
5、李老師：新型電力電子技術(shù)在微網(wǎng)中的應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

仿腦機(jī)器人控制與學(xué)習(xí)系統(tǒng)的制作方法