中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
深度強化學習實戰 用OPENAI GYM構建智能體

包郵 深度強化學習實戰 用OPENAI GYM構建智能體

出版社:人民郵電出版社出版時間:2023-06-01
開本: 16開 頁數: 170
中 圖 價:¥49.9(7.1折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

深度強化學習實戰 用OPENAI GYM構建智能體 版權信息

  • ISBN:9787115561596
  • 條形碼:9787115561596 ; 978-7-115-56159-6
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

深度強化學習實戰 用OPENAI GYM構建智能體 本書特色

一本介紹在OpenAI Gym環節中構建智能體的實戰指南! 只需要專注算法的優化,無需浪費時間去搭建環境! ·從零起步,內容通俗易懂,輕松學習OpenAI Gym的用法·運用強化學習/深度強化學習算法構建智能體,不用浪費時間去搭建環境! ·案例應用側重于游戲、自動駕駛領域,幫你解決基于智能體的領域問題! ·基于Python編程語言,講解基本概念和應用知識,操作易上手!

深度強化學習實戰 用OPENAI GYM構建智能體 內容簡介

這是一本介紹用 OpenAI Gym 構建智能體的實戰指南。全書先簡要介紹智能體和學習環境的一些入門知識,概述強化學習和深度強化學習的基本概念和知識點,然后重點介紹 OpenAI Gym 的相關內容,隨后在具體的 Gym 環境中運用強化學習算法構建智能體。本書還探討了這些算法在游戲、自動駕駛領域的應用。 本書適合想用 OpenAI Gym 構建智能體的讀者閱讀,也適合對強化學習和深度強化學習感興趣的讀者參考。讀者應具備一定的 Python 編程基礎。

深度強化學習實戰 用OPENAI GYM構建智能體 目錄

第 1章 智能體與學習環境入門 1
1.1 智能體簡介 1
1.2 學習環境 2
1.3 OpenAI Gym簡介 3
1.4 理解OpenAI Gym的主要特性 8
1.4.1 簡單的環境接口 8
1.4.2 可比較與可復現 8
1.4.3 進程可監控 9
1.5 OpenAI Gym工具包的作用 9
1.6 創建第 一個OpenAI Gym環境 9
1.7 小結 11
第 2章 強化學習和深度強化學習 12
2.1 強化學習簡介 12
2.2 直觀理解人工智能的含義和內容 13
2.2.1 監督學習 13
2.2.2 非監督學習 14
2.2.3 強化學習 14
2.3 強化學習實戰 14
2.3.1 智能體 15
2.3.2 獎勵 15
2.3.3 環境 15
2.3.4 狀態 16
2.3.5 模型 17
2.3.6 值函數 17
2.3.7 策略 18
2.4 馬爾可夫決策過程 18
2.5 動態規劃 19
2.6 蒙特卡洛學習和時序差分學習 19
2.7 SARSA和Q-Learning 20
2.8 深度強化學習 21
2.9 強化學習和深度強化學習算法的實踐應用 22
2.10 小結 23
第3章 開啟OpenAI Gym和深度強化學習之旅 24
3.1 代碼庫、設置和配置 24
3.1.1 先決條件 25
3.1.2 創建conda環境 26
3.1.3 小化安裝—快捷簡便的方法 27
3.1.4 完整安裝OpenAI Gym學習環境 28
3.2 安裝深度強化學習所需的工具和庫 32
3.2.1 安裝必*的系統軟件包 32
3.2.2 安裝CUDA 33
3.2.3 安裝PyTorch 34
3.3 小結 35
第4章 探索Gym及其功能 36
4.1 探索環境列表和術語 36
4.1.1 術語 37
4.1.2 探索Gym環境 38
4.2 理解Gym接口 40
4.3 Gym中的空間 43
4.4 小結 47
第5章 實現第 一個智能體—解決過山車問題 48
5.1 了解過山車問題 48
5.2 從零開始實現Q-Learning智能體 50
5.2.1 Q-Learning回顧 53
5.2.2 使用Python和NumPy實現Q-Learning智能體 53
5.3 在Gym中訓練強化學習智能體 58
5.4 測試并記錄智能體的性能 58
5.5 一個簡單且完整的Q-Learner實現—過山車問題的解決方案 59
5.6 小結 63
第6章 用深度Q-Learning實現化控制智能體 64
6.1 優化Q-Learning智能體 65
6.1.1 用神經網絡近似Q函數 65
6.1.2 經驗回放 71
6.1.3 重溫ε-貪婪動作策略 74
6.2 實現一個深度Q-Learning智能體 76
6.2.1 用PyTorch實現一個深度卷積Q網絡 77
6.2.2 使用目標Q網絡穩定智能體的學習 78
6.2.3 記錄和可視化智能體的學習過程 79
6.2.4 管理超參數和配置參數 81
6.2.5 用完整的深度Q-Learner處理輸入為原始像素的復雜問題 83
6.3 Atari Gym環境 89
6.4 訓練深度Q-Learner玩Atari游戲 98
6.4.1 整合一個完整的深度Q-Learner 98
6.4.2 超參數 101
6.4.3 啟動訓練過程 102
6.4.4 在Atari游戲中測試深度Q-Learner的性能 103
6.5 小結 104
第7章 創建自定義OpenAI Gym環境—CARLA 105
7.1 理解Gym環境結構 105
7.1.1 為自定義Gym環境實現創建模板 106
7.1.2 在OpenAI Gym環境中注冊自定義環境 108
7.2 創建與OpenAI Gym兼容的CARLA環境 108
7.2.1 配置和初始化 110
7.2.2 實現reset方法 111
7.2.3 為CARLA環境實現step函數 115
7.2.4 測試CARLA Gym環境 120
7.3 小結 122
第8章 用深度演員-評論家算法實現無人駕駛智能體 123
8.1 深度n步優勢演員-評論家算法 123
8.1.1 策略梯度 124
8.1.2 演員-評論家算法 126
8.1.3 優勢演員-評論家算法 127
8.1.4 n步優勢演員-評論家算法 129
8.1.5 深度n步優勢演員-評論家算法 132
8.2 實現深度n步優勢演員-評論家智能體 133
8.2.1 初始化演員和評論家網絡 133
8.2.2 用當前策略獲取n步經驗 137
8.2.3 計算演員和評論家的損失 137
8.2.4 更新演員-評論家模型 139
8.2.5 用于保存/加載、記錄、可視化和監視的工具 139
8.2.6 擴展——異步深度n步優勢演員-評論家 139
8.3 訓練一個“聰明”的自動駕駛智能體 140
8.3.1 訓練和測試深度n步優勢演員-評論家智能體 140
8.3.2 訓練智能體在CARLA中駕駛車輛 143
8.4 小結 144
第9章 探索學習環境全景——Roboschool、Gym Retro、StarCraft-Ⅱ和DeepMind Lab 145
9.1 Gym接口兼容的環境 146
9.1.1 Roboschool 146
9.1.2 Gym Retro 150
9.2 其他基于Python的開源學習環境 153
9.2.1 星際爭霸Ⅱ—PySC2 153
9.2.2 DeepMind Lab 156
9.3 小結 160
第 10章 探索學習算法世界——DDPG(演員-評論家)、PPO (策略梯度)、Rainbow(基于值) 161
10.1 深度確定性策略梯度 162
10.2 近端策略優化 163
10.3 Rainbow 165
10.3.1 核心概念 165
10.3.2 優點及應用簡要總結 169
10.4 小結 170
展開全部

深度強化學習實戰 用OPENAI GYM構建智能體 作者簡介

普拉文·巴拉尼沙米(Praveen Palanisamy)專注于研究自主智能系統。他是通用汽車研發部門的 AI(人工智能)研究員,主要負責針對自動駕駛開發基于深度強化學習的規劃和決策算法。在此之前,他在卡內基-梅隆大學機器人所從事自動導航的研究(包括可移動機器人的感知與智能),曾從零開始研發一個完整的、自動的機器人系統。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
返回頂部
中圖網
在線客服
主站蜘蛛池模板: CNC机加工-数控加工-精密零件加工-ISO认证厂家-鑫创盟 | 科客,主见不成见| 云南成考网_云南成人高考报名网 粤丰硕水性环氧地坪漆-防静电自流平厂家-环保地坪涂料代理 | 创富网-B2B网站|供求信息网|b2b平台|专业电子商务网站 | 语料库-提供经典范文,文案句子,常用文书,您的写作得力助手 | 石磨面粉机|石磨面粉机械|石磨面粉机组|石磨面粉成套设备-河南成立粮油机械有限公司 | 水平垂直燃烧试验仪-灼热丝试验仪-漏电起痕试验仪-针焰试验仪-塑料材料燃烧检测设备-IP防水试验机 | 超声波成孔成槽质量检测仪-压浆机-桥梁预应力智能张拉设备-上海硕冠检测设备有限公司 | 交通信号灯生产厂家_红绿灯厂家_电子警察监控杆_标志杆厂家-沃霖电子科技 | 液氮罐_液氮容器_自增压液氮罐_杜瓦瓶_班德液氮罐厂家 | 非甲烷总烃分析仪|环控百科 | 有机废气处理-rto焚烧炉-催化燃烧设备-VOC冷凝回收装置-三梯环境 | 烘箱-工业烘箱-工业电炉-实验室干燥箱 - 苏州华洁烘箱制造有限公司 | 论文查重_免费论文查重_知网学术不端论文查重检测系统入口_论文查重软件 | 清洁设备_洗地机/扫地机厂家_全自动洗地机_橙犀清洁设备官网 | 布袋式除尘器|木工除尘器|螺旋输送机|斗式提升机|刮板输送机|除尘器配件-泊头市德佳环保设备 | 【电子厂招聘_普工招工网_工厂招聘信息平台】-工立方打工网 | 密集架|电动密集架|移动密集架|黑龙江档案密集架-大量现货厂家销售 | uv机-uv灯-uvled光固化机-生产厂家-蓝盾机电 | 中宏网-今日新闻-财经新闻| 回收二手冲床_金丰旧冲床回收_协易冲床回收 - 大鑫机械设备 | 工程管道/塑料管材/pvc排水管/ppr给水管/pe双壁波纹管等品牌管材批发厂家-河南洁尔康建材 | 聚丙烯酰胺_厂家_价格-河南唐达净水材料有限公司 | 炭黑吸油计_测试仪,单颗粒子硬度仪_ASTM标准炭黑自销-上海贺纳斯仪器仪表有限公司(HITEC中国办事处) | 天津蒸汽/热水锅炉-电锅炉安装维修直销厂家-天津鑫淼暖通设备有限公司 | 大型多片锯,圆木多片锯,方木多片锯,板材多片锯-祥富机械有限公司 | 走心机厂家,数控走心机-台州博城智能科技有限公司 | 精密钢管,冷拔精密无缝钢管,精密钢管厂,精密钢管制造厂家,精密钢管生产厂家,山东精密钢管厂家 | PVC快速门-硬质快速门-洁净室快速门品牌厂家-苏州西朗门业 | 除甲醛公司-甲醛检测治理-杭州创绿家环保科技有限公司-室内空气净化十大品牌 | 祝融环境-地源热泵多恒系统高新技术企业,舒适生活环境缔造者! | 低噪声电流前置放大器-SR570电流前置放大器-深圳市嘉士达精密仪器有限公司 | 焊锡丝|焊锡条|无铅锡条|无铅锡丝|无铅焊锡线|低温锡膏-深圳市川崎锡业科技有限公司 | 一体化污水处理设备_生活污水处理设备_全自动加药装置厂家-明基环保 | 台式核磁共振仪,玻璃软化点测定仪,旋转高温粘度计,测温锥和测温块-上海麟文仪器 | 智能型高压核相仪-自动开口闪点测试仪-QJ41A电雷管测试仪|上海妙定 | 北京翻译公司_同传翻译_字幕翻译_合同翻译_英语陪同翻译_影视翻译_翻译盖章-译铭信息 | 飞利浦LED体育场灯具-吸顶式油站灯-飞利浦LED罩棚灯-佛山嘉耀照明有限公司 | 螺纹三通快插接头-弯通快插接头-宁波舜驰气动科技有限公司 | 五轴加工中心_数控加工中心_铝型材加工中心-罗威斯 | 薪动-人力资源公司-灵活用工薪资代发-费用结算-残保金优化-北京秒付科技有限公司 |