中圖價(jià):¥94.7
加入購(gòu)物車
游戲人工智能方法 版權(quán)信息
- ISBN:9787030770950
- 條形碼:9787030770950 ; 978-7-03-077095-0
- 裝幀:精裝
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類:>
游戲人工智能方法 內(nèi)容簡(jiǎn)介
本書嘗試歸納總結(jié)近年來(lái)游戲人工智能方向的優(yōu)秀研究工作以及我們的一些探索呈現(xiàn)給讀者。首先介紹游戲人工智能的背景和意義、發(fā)展歷史和研究現(xiàn)狀、平臺(tái)和問(wèn)題,然后梳理經(jīng)典的游戲人工智能方法,并給出DeepMind公司近幾年針對(duì)棋牌和視頻類游戲所提出的優(yōu)秀的人工智能方法。之后是著者團(tuán)隊(duì)的具體研究工作和算法介紹,所考慮的問(wèn)題都是有挑戰(zhàn)的即時(shí)制游戲問(wèn)題,包括格斗游戲的實(shí)時(shí)性和角色變化、ViZDoom游戲的**視角屬性、星際爭(zhēng)霸的宏觀生產(chǎn)和微觀操作的不接近信息和多個(gè)體特點(diǎn)等,給出了相應(yīng)的解決方法。從理論分析到算法設(shè)計(jì)到編程實(shí)現(xiàn),旨在為讀者提供一個(gè)針對(duì)不同游戲人工智能問(wèn)題的系統(tǒng)性論述。
游戲人工智能方法 目錄
目錄“新一代人工智能理論、技術(shù)及應(yīng)用叢書”序前言第1章游戲人工智能介紹11.1引言11.1.1游戲人工智能背景和意義11.1.2游戲人工智能研究發(fā)展11.2回合制游戲人工智能31.2.1棋類游戲人工智能發(fā)展歷程31.2.2牌類游戲人工智能發(fā)展歷程41.2.3棋牌類游戲人工智能測(cè)試平臺(tái)51.3即時(shí)制游戲人工智能71.3.1即時(shí)制游戲平臺(tái)和競(jìng)賽71.3.2雅達(dá)利游戲81.3.3**人稱視角游戲91.3.4即時(shí)策略游戲101.4游戲人工智能的關(guān)鍵性挑戰(zhàn)與研究思路121.5游戲人工智能的未來(lái)發(fā)展趨勢(shì)與展望131.5.1基于深度強(qiáng)化學(xué)習(xí)方法的策略模型泛化性141.5.2構(gòu)建高效魯棒合理的前向推理模型141.5.3增強(qiáng)模型的環(huán)境適應(yīng)和學(xué)習(xí)優(yōu)化性能141.5.4從虛擬環(huán)境到實(shí)際應(yīng)用的遷移151.6本章小結(jié)15參考文獻(xiàn)15第2章基本游戲人工智能方法202.1引言202.2**博弈樹模型202.2.1極小化極大算法202.2.2α-β剪枝算法212.3統(tǒng)計(jì)前向規(guī)劃222.3.1蒙特卡羅樹搜索算法232.3.2滾動(dòng)時(shí)域演化算法262.4強(qiáng)化學(xué)習(xí)272.4.1蒙特卡羅算法292.4.2時(shí)間差分強(qiáng)化學(xué)習(xí)算法302.4.3策略梯度學(xué)習(xí)算法312.5深度強(qiáng)化學(xué)習(xí)332.5.1深度Q網(wǎng)絡(luò)及其擴(kuò)展342.5.2異步優(yōu)勢(shì)執(zhí)行器-評(píng)價(jià)器算法及其擴(kuò)展382.5.3策略梯度深度強(qiáng)化學(xué)習(xí)402.5.4面向?qū)共┺牡纳疃葟?qiáng)化學(xué)習(xí)432.6本章小結(jié)45參考文獻(xiàn)45第3章DeepMind游戲人工智能方法513.1引言513.2AlphaGo513.2.1算法概述523.2.2計(jì)算機(jī)圍棋的發(fā)展歷史與現(xiàn)狀523.2.3原理分析533.2.4性能分析563.2.5評(píng)價(jià)573.3AlphaGoZero.583.3.1算法概述583.3.2深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)613.3.3蒙特卡羅樹搜索613.3.4訓(xùn)練流程643.3.5討論653.4AlphaZero和MuZero663.4.1AlphaZero概述673.4.2MuZero概述683.4.3算法解析703.4.4性能分析723.5AlphaStar743.5.1星際爭(zhēng)霸研究意義743.5.2算法概述753.5.3算法解析763.5.4性能分析783.6本章小結(jié)81參考文獻(xiàn)82第4章兩人零和馬爾可夫博弈的極小化極大Q網(wǎng)絡(luò)算法854.1引言854.2兩人零和馬爾可夫博弈的基本知識(shí)864.2.1兩人零和馬爾可夫博弈864.2.2納什均衡或極小化極大均衡864.2.3極小化極大價(jià)值和極小化極大方程864.2.4線性規(guī)劃求解極小化極大解874.3動(dòng)態(tài)規(guī)劃求解貝爾曼極小化極大方程884.3.1值迭代884.3.2策略迭代884.3.3廣義策略迭代894.4極小化極大Q網(wǎng)絡(luò)算法904.4.1Q函數(shù)神經(jīng)網(wǎng)絡(luò)904.4.2在線學(xué)習(xí)904.4.3M2QN算法在查表法下的收斂性924.5仿真實(shí)驗(yàn)944.5.1足球博弈944.5.2守護(hù)領(lǐng)土964.5.3格斗游戲984.6本章小結(jié)101參考文獻(xiàn)101第5章格斗游戲的對(duì)手模型和滾動(dòng)時(shí)域演化算法1045.1引言1045.2基于滾動(dòng)時(shí)域演化的統(tǒng)計(jì)前向規(guī)劃建模1055.2.1格斗游戲問(wèn)題定義1055.2.2滾動(dòng)時(shí)域演化算法1055.3基于自適應(yīng)對(duì)手模型的神經(jīng)網(wǎng)絡(luò)建模1075.3.1對(duì)手模型建模1075.3.2監(jiān)督學(xué)習(xí)式對(duì)手模型1075.3.3強(qiáng)化學(xué)習(xí)式對(duì)手模型1085.4實(shí)驗(yàn)設(shè)計(jì)與測(cè)試結(jié)果1105.4.1實(shí)驗(yàn)設(shè)置與測(cè)試平臺(tái)1105.4.2內(nèi)部比較1115.4.3對(duì)抗2018年格斗游戲程序1135.4.4兩種統(tǒng)計(jì)前向規(guī)劃與對(duì)手建模結(jié)合的性能比較1145.4.52019年格斗游戲競(jìng)賽結(jié)果1155.4.62020年格斗游戲競(jìng)賽結(jié)果1155.4.7性能指標(biāo)分析1165.4.8討論1215.5本章小結(jié)121參考文獻(xiàn)122第6章星際爭(zhēng)霸宏觀生產(chǎn)的深度強(qiáng)化學(xué)習(xí)算法1246.1引言1246.2星際爭(zhēng)霸宏觀生產(chǎn)決策分析與建模1256.2.1問(wèn)題定義1256.2.2輸入狀態(tài)特征1266.2.3決策動(dòng)作定義1286.2.4決策神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)1286.2.5基于策略和價(jià)值混合式網(wǎng)絡(luò)的決策系統(tǒng)優(yōu)化方法1296.3實(shí)驗(yàn)設(shè)置與結(jié)果分析1326.3.1星際爭(zhēng)霸宏觀決策對(duì)抗優(yōu)化場(chǎng)景1326.3.2對(duì)抗優(yōu)化場(chǎng)景下的實(shí)驗(yàn)結(jié)果1336.3.3星際爭(zhēng)霸學(xué)生天梯賽1366.4本章小結(jié)136參考文獻(xiàn)136第7章星際爭(zhēng)霸微操的強(qiáng)化學(xué)習(xí)和課程遷移學(xué)習(xí)算法1387.1引言1387.2星際爭(zhēng)霸微操任務(wù)分析與建模1397.2.1問(wèn)題定義1397.2.2高維狀態(tài)表示1407.2.3動(dòng)作定義1417.2.4網(wǎng)絡(luò)結(jié)構(gòu)1417.3基于強(qiáng)化學(xué)習(xí)的星際爭(zhēng)霸多單位控制1427.3.1共享參數(shù)多智能體梯度下降Sarsa(λ)算法1437.3.2獎(jiǎng)賞函數(shù)1447.3.3幀跳躍1457.3.4課程遷移學(xué)習(xí)1457.4實(shí)驗(yàn)設(shè)置和結(jié)果分析1467.4.1星際爭(zhēng)霸微操場(chǎng)景設(shè)置1467.4.2結(jié)果討論1477.4.3策略分析1517.5本章小結(jié)154參考文獻(xiàn)154第8章星際爭(zhēng)霸微操的可變數(shù)量多智能體強(qiáng)化學(xué)習(xí)算法1568.1引言1568.2背景知識(shí)與相關(guān)工作1568.2.1多智能體強(qiáng)化學(xué)習(xí)1568.2.2聯(lián)合觀測(cè)動(dòng)作價(jià)值函數(shù)分解1588.2.3相關(guān)工作1588.3可變數(shù)量多智能體強(qiáng)化學(xué)習(xí)1628.3.1自加權(quán)混合網(wǎng)絡(luò)1628.3.2適應(yīng)動(dòng)作空間變化的智能體網(wǎng)絡(luò)1658.3.3可變網(wǎng)絡(luò)的訓(xùn)練算法1668.4星際爭(zhēng)霸II微操實(shí)驗(yàn)1698.4.1可變網(wǎng)絡(luò)在星際爭(zhēng)霸II微操環(huán)境的實(shí)驗(yàn)設(shè)置1698.4.2可變網(wǎng)絡(luò)實(shí)驗(yàn)結(jié)果1708.4.3消融實(shí)驗(yàn)1728.4.4可變網(wǎng)絡(luò)策略分析1748.5本章小結(jié)175參考文獻(xiàn)176附錄A強(qiáng)化學(xué)習(xí)符號(hào)表178附錄B主要詞匯中英文對(duì)照表179
展開全部
書友推薦
- >
唐代進(jìn)士錄
- >
我從未如此眷戀人間
- >
隨園食單
- >
羅庸西南聯(lián)大授課錄
- >
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
- >
李白與唐代文化
- >
名家?guī)阕x魯迅:朝花夕拾
- >
月亮與六便士
本類暢銷