預估到手價是按參與促銷活動、以最優惠的購買方案計算出的價格(不含優惠券部分),僅供參考,未必等同于實際到手價。
-
>
論中國
-
>
中共中央在西柏坡
-
>
同盟的真相:美國如何秘密統治日本
-
>
中國歷代政治得失
-
>
中國共產黨的一百年
-
>
習近平談治國理政 第四卷
-
>
在慶祝中國共產主義青年團成立100周年大會上的講話
基于深度強化學習的作戰任務規劃技術研究 版權信息
- ISBN:9787522117270
- 條形碼:9787522117270 ; 978-7-5221-1727-0
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
基于深度強化學習的作戰任務規劃技術研究 內容簡介
本書從分層強化學習框架結構、知識引導的深度強化學習、數據驅動的多智能協同規劃、離線與在線結合的任務規劃等方面有重點地研究了基于深度強化學習的作戰任務規劃問題,同時結合作戰任務規劃典型特征與現實需求,分析了其面臨的挑戰、適用性,并給出了作戰任務規劃結果的效能評估模型。 本書內容注重技術引領、理技融合、系統完整,是深度強化學習技術應用于作戰任務規劃領域的一次積極探索與實踐。本書既可以作為軍事人工智能、計算機科學與技術領域高校師生的選修課程教材,又可以作為軍事運籌學、軍事裝備學研究生的專業教材,還適合國防科技研究人員和廣大軍事愛好者閱讀,為其工程實踐提供方法指導和思維啟發。
基于深度強化學習的作戰任務規劃技術研究 目錄
1.1 作戰任務規劃及其技術發展
1.1.1 作戰任務規劃的概念內涵
1.1.2 作戰任務規劃的功能定位
1.1.3 國外作戰任務規劃系統與技術
1.1.4 國內作戰任務規劃系統與技術
1.2 深度強化學習及其發展現狀
1.3 基于深度強化學習的作戰任務規劃適用性分析
1.4 基于深度強化學習的作戰任務規劃面臨的挑戰
1.4.1 不完信息條件下的戰場態勢特征建模問題
1.4.2 作戰任務規劃行動決策空間維度災難問題
1.4.3 基于DRL的作戰行動序列獎賞函數設計問題
1.4.4 基于DRL的作戰任務規劃模型可解釋性問題
第2章 基于分層強化學習的作戰任務規劃框架
2.1 基于分層強化學習的作戰任務規劃框架設計
2.2 基于層次任務網的作戰任務分解
2.3 基于強化學習的作戰任務規劃模型
2.3.1 復雜戰場態勢特征表示的基本過程
2.3.2 作戰任務規劃中不確定性與對手建模
2.3.3 戰場態勢特征深度神經網絡建模
2.3.4 作戰任務智能規劃的POMDP模型
2.4 面向作戰任務規劃的分層強化學習算法
2.4.1 HAM分層抽象機
2.4.2 MAxQ值函數分解
2.4.3 0ption選項框架
第3章 知識引導的深度強化學習方法
3.1 基于知識與DQN的單智能體任務規劃
3.1.1 基于規則的強化學習算法框架
3.1.2 智能戰術決策中的MDP模型
3.1.3 基于產生式規則的戰術知識
3.1.4 基于產生式規則的損失函數設計
3.1.5 基于產生式規則的作戰任務智能規劃仿真實驗
3.2 基于綜合勢能的強化學習啟發式探索策略
3.2.1 綜合勢能理論分析
3.2.2 綜合勢能模型構建
3.2.3 綜合勢能驅動的強化學習探索策略
3.2.4 基于綜合勢能的作戰仿真實驗設計
3.3 Actor-Critic框架下基于知識的多智能體協同規劃
3.3.1 智能戰術兵棋環境中強化學習的獎勵函數設計
3.3.2 Actor-Crific框架下的多智能體協同作戰算法
3.3.3 算法仿真實驗驗證與分析
第4章 數據驅動的多智能體博弈對抗協同規劃
4.1 數據驅動的多智能體博弈對抗協同規劃
4.1.1 作戰實體博弈對抗算法設計
4.1.2 基于PPO的算法實驗驗證
4.1.3 仿真實驗結果分析
4.2 基于逆向強化學習的陸戰分隊戰術任務規劃
4.2.1 基于深度強化學習韻陸戰分隊戰術任務規劃模型
4.2.2 基于IRL和DQN的陸戰分隊戰術規劃求解模型
4.2.3 實驗方案總結
第5章 離線學習與在線博弈結合的作戰任務規劃與評估
5.1 作戰想定設計與實驗平臺選擇
5.1.1 實驗總體設計
5.1.2 作戰想定描述
5.1.3 陸戰兵棋對抗平臺
5.2 MCTS框架下基于深度策略網的在線行動規劃
5.2.1 蒙特卡洛樹搜索基本思想與模型
5.2.2 基于MCTS和深度策略網的行動序列生成
5.3 典型作戰任務智能規劃與分析評估
5.3.1 基于綜合勢能的智能任務規劃算例分析
5.3.2 基于MCTS和綜合勢能的智能任務規劃算例分析
5.3.3 多視角、全過程的作戰任務規劃評估與分析
附錄A “先勝1號”陸戰智能兵棋推演平臺Al接口
A.1 文檔說明
A.1.1 功能描述
A.1.2 閱讀對象
A.1.3 使用環境
A.2 接口設計框架
A.2.1 接口設計需求
A.2.2 接口設計框架
A.3 接口說明
A.3.1 算子介紹
A.3.2 算子控制接口
A.3.3 信息查詢接口
A.3.4 分析工具接口
附錄B 強化學習對抗賽算法設計說明
基于Actor-Critic算法的混合智能戰術兵棋模型設計
基于PPO算法的兵棋強化學習
基于規則優先級選擇的智能兵棋規則算法設計
基于規則和隨機*近距離的算法設計
基于博弈策略選擇的規則驅動型智能兵棋模型設計
基于先驗知識及DQN算法的混合智能兵棋研究與實現
實時態勢驅動的智能戰術兵棋算法模型設計與實現
參考文獻
基于深度強化學習的作戰任務規劃技術研究 作者簡介
張永亮,男,1982年出生,軍隊指揮學博士,計算機科學與技術博士后。現為陸**程大學副教授,主要研究指控理論與仿真、智能任務規劃。先后獲軍隊和省部級科技進步一等獎2項、軍隊科技進步二等獎1項、軍隊科技進步三等獎3項;獲中國博士后科學基金面上一等和特別項目資助,主持裝發領域基金、科技委國防科技創新特區、陸軍十三五規劃項目多項;參與國家自然科學基金、中國工程院院士重點課題、江蘇省自然科學基金多項;出版著作5部,在軍內外核心期刊發表論文60余篇。2018年被表彰為陸**程大學“科研先進個人”,榮立個人三等功1次。
- >
龍榆生:詞曲概論/大家小書
- >
有舍有得是人生
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
小考拉的故事-套裝共3冊
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
中國歷史的瞬間
- >
巴金-再思錄
- >
隨園食單