掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
多機器人系統強化學習 版權信息
- ISBN:9787563570607
- 條形碼:9787563570607 ; 978-7-5635-7060-7
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
多機器人系統強化學習 內容簡介
本書以強化學習算法與多機器人系統的結合為主要背景,介紹了主要的強化學習算法模型,討論了它們的原理和優缺點;本書針對多機器人協作,從實際應用問題的角度分析,指出了局部性、不確定性和自組織網絡等在學習中的現實意義;本書針對強化學習存在的學習速度慢、計算復雜度高等問題,研究了幾種改進算法,并基于MATLAB設計了機器人仿真工具箱,以機器人路徑規劃與覆蓋問題為背景進行了仿真研究。
多機器人系統強化學習 目錄
第1章 緒論
1.1 研究背景與意義
1.2 機器學習算法
1.3 多機器人的協調與協作
1.4 不確定環境下的多機器人系統
本章參考文獻
第2章 多機器人協作與強化學習模型
2.1 引言
2.2 強化學習原理
2.2.1 強化學習結構
2.2.2 Monte Carlo算法
2.2.3 瞬時差分法
2.2.4 Q-學習
2.2.5 Sarsa算法
2.2.6 Actor-Critic學習算法
2.2.7 R-學習算法
2.3 分布式強化學習模型
2.3.1 分布式強化學習模型
2.3.2 研究現況及存在的問題
2.4 多機器人決策模型
2.4.1 馬爾可夫模型
2.4.2 分布式馬爾可夫模型
2.4.3 局部可觀測的馬爾可夫模型
2.4.4 分布式局部可觀測的馬爾可夫模型
2.4.5 研究現狀與存在的問題
2.5 多機器人一致性模型
2.5.1 圖論
2.5.2 矩陣論
2.5.3 Gossip一致性算法
2.5.4 離散一致性算法
2.6 強化學習存在問題及改進分析
2.6.1 盲目搜索方式與啟發式搜索方式分析
2.6.2 啟發式強化學習分析
2.6.3 遷移強化學習分析
2.6.4 事件驅動與機器學習的結合問題分析
2.7 本章小結
本章參考文獻
第3章 基于一致性的多機器人強化學習研究
3.1 引言
3.2 基于一致性的DEC-POMDP強化學習框架
3.2.1 強化學習中的局部觀測性和不確定性
3.2.2 分布式多機器人強化學習模型
3.2.3 多機器人強化學習一致性設計方案
3.3 基于一致性的多機器人強化學習算法
3.3.1 基于一致性的多機器人強化學習算法
3.3.2 基于一致性的策略化簡
3.4 收斂性分析
3.5 仿真實驗
3.6 本章小結
本章參考文獻
展開全部
多機器人系統強化學習 作者簡介
張文旭,蘭州理工大學,副教授,碩導。發表學術論文20余篇,其中EI收錄13篇、SCI收錄4篇(第一作者或通訊作者4篇);主持或參與國家自然基金項目5項,甘肅省自然基金項目4項,主持企業委托項目2項;獲授權國家發明專利2項、實用新型專利3項、軟件著作權4項。
書友推薦
- >
伊索寓言-世界文學名著典藏-全譯本
- >
自卑與超越
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
中國歷史的瞬間
- >
中國人在烏蘇里邊疆區:歷史與人類學概述
- >
姑媽的寶刀
- >
月亮虎
- >
煙與鏡
本類暢銷