-
>
論中國
-
>
中共中央在西柏坡
-
>
同盟的真相:美國如何秘密統(tǒng)治日本
-
>
中國歷代政治得失
-
>
中國共產(chǎn)黨的一百年
-
>
習(xí)近平談治國理政 第四卷
-
>
在慶祝中國共產(chǎn)主義青年團成立100周年大會上的講話
基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃技術(shù)研究 版權(quán)信息
- ISBN:9787522117270
- 條形碼:9787522117270 ; 978-7-5221-1727-0
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃技術(shù)研究 內(nèi)容簡介
本書從分層強化學(xué)習(xí)框架結(jié)構(gòu)、知識引導(dǎo)的深度強化學(xué)習(xí)、數(shù)據(jù)驅(qū)動的多智能協(xié)同規(guī)劃、離線與在線結(jié)合的任務(wù)規(guī)劃等方面有重點地研究了基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃問題,同時結(jié)合作戰(zhàn)任務(wù)規(guī)劃典型特征與現(xiàn)實需求,分析了其面臨的挑戰(zhàn)、適用性,并給出了作戰(zhàn)任務(wù)規(guī)劃結(jié)果的效能評估模型。 本書內(nèi)容注重技術(shù)引領(lǐng)、理技融合、系統(tǒng)完整,是深度強化學(xué)習(xí)技術(shù)應(yīng)用于作戰(zhàn)任務(wù)規(guī)劃領(lǐng)域的一次積極探索與實踐。本書既可以作為軍事人工智能、計算機科學(xué)與技術(shù)領(lǐng)域高校師生的選修課程教材,又可以作為軍事運籌學(xué)、軍事裝備學(xué)研究生的專業(yè)教材,還適合國防科技研究人員和廣大軍事愛好者閱讀,為其工程實踐提供方法指導(dǎo)和思維啟發(fā)。
基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃技術(shù)研究 目錄
1.1 作戰(zhàn)任務(wù)規(guī)劃及其技術(shù)發(fā)展
1.1.1 作戰(zhàn)任務(wù)規(guī)劃的概念內(nèi)涵
1.1.2 作戰(zhàn)任務(wù)規(guī)劃的功能定位
1.1.3 國外作戰(zhàn)任務(wù)規(guī)劃系統(tǒng)與技術(shù)
1.1.4 國內(nèi)作戰(zhàn)任務(wù)規(guī)劃系統(tǒng)與技術(shù)
1.2 深度強化學(xué)習(xí)及其發(fā)展現(xiàn)狀
1.3 基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃適用性分析
1.4 基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃面臨的挑戰(zhàn)
1.4.1 不完信息條件下的戰(zhàn)場態(tài)勢特征建模問題
1.4.2 作戰(zhàn)任務(wù)規(guī)劃行動決策空間維度災(zāi)難問題
1.4.3 基于DRL的作戰(zhàn)行動序列獎賞函數(shù)設(shè)計問題
1.4.4 基于DRL的作戰(zhàn)任務(wù)規(guī)劃模型可解釋性問題
第2章 基于分層強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃框架
2.1 基于分層強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃框架設(shè)計
2.2 基于層次任務(wù)網(wǎng)的作戰(zhàn)任務(wù)分解
2.3 基于強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃模型
2.3.1 復(fù)雜戰(zhàn)場態(tài)勢特征表示的基本過程
2.3.2 作戰(zhàn)任務(wù)規(guī)劃中不確定性與對手建模
2.3.3 戰(zhàn)場態(tài)勢特征深度神經(jīng)網(wǎng)絡(luò)建模
2.3.4 作戰(zhàn)任務(wù)智能規(guī)劃的POMDP模型
2.4 面向作戰(zhàn)任務(wù)規(guī)劃的分層強化學(xué)習(xí)算法
2.4.1 HAM分層抽象機
2.4.2 MAxQ值函數(shù)分解
2.4.3 0ption選項框架
第3章 知識引導(dǎo)的深度強化學(xué)習(xí)方法
3.1 基于知識與DQN的單智能體任務(wù)規(guī)劃
3.1.1 基于規(guī)則的強化學(xué)習(xí)算法框架
3.1.2 智能戰(zhàn)術(shù)決策中的MDP模型
3.1.3 基于產(chǎn)生式規(guī)則的戰(zhàn)術(shù)知識
3.1.4 基于產(chǎn)生式規(guī)則的損失函數(shù)設(shè)計
3.1.5 基于產(chǎn)生式規(guī)則的作戰(zhàn)任務(wù)智能規(guī)劃仿真實驗
3.2 基于綜合勢能的強化學(xué)習(xí)啟發(fā)式探索策略
3.2.1 綜合勢能理論分析
3.2.2 綜合勢能模型構(gòu)建
3.2.3 綜合勢能驅(qū)動的強化學(xué)習(xí)探索策略
3.2.4 基于綜合勢能的作戰(zhàn)仿真實驗設(shè)計
3.3 Actor-Critic框架下基于知識的多智能體協(xié)同規(guī)劃
3.3.1 智能戰(zhàn)術(shù)兵棋環(huán)境中強化學(xué)習(xí)的獎勵函數(shù)設(shè)計
3.3.2 Actor-Crific框架下的多智能體協(xié)同作戰(zhàn)算法
3.3.3 算法仿真實驗驗證與分析
第4章 數(shù)據(jù)驅(qū)動的多智能體博弈對抗協(xié)同規(guī)劃
4.1 數(shù)據(jù)驅(qū)動的多智能體博弈對抗協(xié)同規(guī)劃
4.1.1 作戰(zhàn)實體博弈對抗算法設(shè)計
4.1.2 基于PPO的算法實驗驗證
4.1.3 仿真實驗結(jié)果分析
4.2 基于逆向強化學(xué)習(xí)的陸戰(zhàn)分隊?wèi)?zhàn)術(shù)任務(wù)規(guī)劃
4.2.1 基于深度強化學(xué)習(xí)韻陸戰(zhàn)分隊?wèi)?zhàn)術(shù)任務(wù)規(guī)劃模型
4.2.2 基于IRL和DQN的陸戰(zhàn)分隊?wèi)?zhàn)術(shù)規(guī)劃求解模型
4.2.3 實驗方案總結(jié)
第5章 離線學(xué)習(xí)與在線博弈結(jié)合的作戰(zhàn)任務(wù)規(guī)劃與評估
5.1 作戰(zhàn)想定設(shè)計與實驗平臺選擇
5.1.1 實驗總體設(shè)計
5.1.2 作戰(zhàn)想定描述
5.1.3 陸戰(zhàn)兵棋對抗平臺
5.2 MCTS框架下基于深度策略網(wǎng)的在線行動規(guī)劃
5.2.1 蒙特卡洛樹搜索基本思想與模型
5.2.2 基于MCTS和深度策略網(wǎng)的行動序列生成
5.3 典型作戰(zhàn)任務(wù)智能規(guī)劃與分析評估
5.3.1 基于綜合勢能的智能任務(wù)規(guī)劃算例分析
5.3.2 基于MCTS和綜合勢能的智能任務(wù)規(guī)劃算例分析
5.3.3 多視角、全過程的作戰(zhàn)任務(wù)規(guī)劃評估與分析
附錄A “先勝1號”陸戰(zhàn)智能兵棋推演平臺Al接口
A.1 文檔說明
A.1.1 功能描述
A.1.2 閱讀對象
A.1.3 使用環(huán)境
A.2 接口設(shè)計框架
A.2.1 接口設(shè)計需求
A.2.2 接口設(shè)計框架
A.3 接口說明
A.3.1 算子介紹
A.3.2 算子控制接口
A.3.3 信息查詢接口
A.3.4 分析工具接口
附錄B 強化學(xué)習(xí)對抗賽算法設(shè)計說明
基于Actor-Critic算法的混合智能戰(zhàn)術(shù)兵棋模型設(shè)計
基于PPO算法的兵棋強化學(xué)習(xí)
基于規(guī)則優(yōu)先級選擇的智能兵棋規(guī)則算法設(shè)計
基于規(guī)則和隨機*近距離的算法設(shè)計
基于博弈策略選擇的規(guī)則驅(qū)動型智能兵棋模型設(shè)計
基于先驗知識及DQN算法的混合智能兵棋研究與實現(xiàn)
實時態(tài)勢驅(qū)動的智能戰(zhàn)術(shù)兵棋算法模型設(shè)計與實現(xiàn)
參考文獻
基于深度強化學(xué)習(xí)的作戰(zhàn)任務(wù)規(guī)劃技術(shù)研究 作者簡介
張永亮,男,1982年出生,軍隊指揮學(xué)博士,計算機科學(xué)與技術(shù)博士后。現(xiàn)為陸**程大學(xué)副教授,主要研究指控理論與仿真、智能任務(wù)規(guī)劃。先后獲軍隊和省部級科技進步一等獎2項、軍隊科技進步二等獎1項、軍隊科技進步三等獎3項;獲中國博士后科學(xué)基金面上一等和特別項目資助,主持裝發(fā)領(lǐng)域基金、科技委國防科技創(chuàng)新特區(qū)、陸軍十三五規(guī)劃項目多項;參與國家自然科學(xué)基金、中國工程院院士重點課題、江蘇省自然科學(xué)基金多項;出版著作5部,在軍內(nèi)外核心期刊發(fā)表論文60余篇。2018年被表彰為陸**程大學(xué)“科研先進個人”,榮立個人三等功1次。
- >
伊索寓言-世界文學(xué)名著典藏-全譯本
- >
有舍有得是人生
- >
巴金-再思錄
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
朝聞道
- >
二體千字文
- >
回憶愛瑪儂
- >
伯納黛特,你要去哪(2021新版)