中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
深度強化學習實戰 用OPENAI GYM構建智能體

包郵 深度強化學習實戰 用OPENAI GYM構建智能體

出版社:人民郵電出版社出版時間:2023-06-01
開本: 16開 頁數: 170
中 圖 價:¥49.9(7.1折) 定價  ¥69.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

深度強化學習實戰 用OPENAI GYM構建智能體 版權信息

  • ISBN:9787115561596
  • 條形碼:9787115561596 ; 978-7-115-56159-6
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

深度強化學習實戰 用OPENAI GYM構建智能體 本書特色

一本介紹在OpenAI Gym環節中構建智能體的實戰指南! 只需要專注算法的優化,無需浪費時間去搭建環境! ·從零起步,內容通俗易懂,輕松學習OpenAI Gym的用法·運用強化學習/深度強化學習算法構建智能體,不用浪費時間去搭建環境! ·案例應用側重于游戲、自動駕駛領域,幫你解決基于智能體的領域問題! ·基于Python編程語言,講解基本概念和應用知識,操作易上手!

深度強化學習實戰 用OPENAI GYM構建智能體 內容簡介

這是一本介紹用 OpenAI Gym 構建智能體的實戰指南。全書先簡要介紹智能體和學習環境的一些入門知識,概述強化學習和深度強化學習的基本概念和知識點,然后重點介紹 OpenAI Gym 的相關內容,隨后在具體的 Gym 環境中運用強化學習算法構建智能體。本書還探討了這些算法在游戲、自動駕駛領域的應用。 本書適合想用 OpenAI Gym 構建智能體的讀者閱讀,也適合對強化學習和深度強化學習感興趣的讀者參考。讀者應具備一定的 Python 編程基礎。

深度強化學習實戰 用OPENAI GYM構建智能體 目錄

第 1章 智能體與學習環境入門 1
1.1 智能體簡介 1
1.2 學習環境 2
1.3 OpenAI Gym簡介 3
1.4 理解OpenAI Gym的主要特性 8
1.4.1 簡單的環境接口 8
1.4.2 可比較與可復現 8
1.4.3 進程可監控 9
1.5 OpenAI Gym工具包的作用 9
1.6 創建第 一個OpenAI Gym環境 9
1.7 小結 11
第 2章 強化學習和深度強化學習 12
2.1 強化學習簡介 12
2.2 直觀理解人工智能的含義和內容 13
2.2.1 監督學習 13
2.2.2 非監督學習 14
2.2.3 強化學習 14
2.3 強化學習實戰 14
2.3.1 智能體 15
2.3.2 獎勵 15
2.3.3 環境 15
2.3.4 狀態 16
2.3.5 模型 17
2.3.6 值函數 17
2.3.7 策略 18
2.4 馬爾可夫決策過程 18
2.5 動態規劃 19
2.6 蒙特卡洛學習和時序差分學習 19
2.7 SARSA和Q-Learning 20
2.8 深度強化學習 21
2.9 強化學習和深度強化學習算法的實踐應用 22
2.10 小結 23
第3章 開啟OpenAI Gym和深度強化學習之旅 24
3.1 代碼庫、設置和配置 24
3.1.1 先決條件 25
3.1.2 創建conda環境 26
3.1.3 小化安裝—快捷簡便的方法 27
3.1.4 完整安裝OpenAI Gym學習環境 28
3.2 安裝深度強化學習所需的工具和庫 32
3.2.1 安裝必*的系統軟件包 32
3.2.2 安裝CUDA 33
3.2.3 安裝PyTorch 34
3.3 小結 35
第4章 探索Gym及其功能 36
4.1 探索環境列表和術語 36
4.1.1 術語 37
4.1.2 探索Gym環境 38
4.2 理解Gym接口 40
4.3 Gym中的空間 43
4.4 小結 47
第5章 實現第 一個智能體—解決過山車問題 48
5.1 了解過山車問題 48
5.2 從零開始實現Q-Learning智能體 50
5.2.1 Q-Learning回顧 53
5.2.2 使用Python和NumPy實現Q-Learning智能體 53
5.3 在Gym中訓練強化學習智能體 58
5.4 測試并記錄智能體的性能 58
5.5 一個簡單且完整的Q-Learner實現—過山車問題的解決方案 59
5.6 小結 63
第6章 用深度Q-Learning實現化控制智能體 64
6.1 優化Q-Learning智能體 65
6.1.1 用神經網絡近似Q函數 65
6.1.2 經驗回放 71
6.1.3 重溫ε-貪婪動作策略 74
6.2 實現一個深度Q-Learning智能體 76
6.2.1 用PyTorch實現一個深度卷積Q網絡 77
6.2.2 使用目標Q網絡穩定智能體的學習 78
6.2.3 記錄和可視化智能體的學習過程 79
6.2.4 管理超參數和配置參數 81
6.2.5 用完整的深度Q-Learner處理輸入為原始像素的復雜問題 83
6.3 Atari Gym環境 89
6.4 訓練深度Q-Learner玩Atari游戲 98
6.4.1 整合一個完整的深度Q-Learner 98
6.4.2 超參數 101
6.4.3 啟動訓練過程 102
6.4.4 在Atari游戲中測試深度Q-Learner的性能 103
6.5 小結 104
第7章 創建自定義OpenAI Gym環境—CARLA 105
7.1 理解Gym環境結構 105
7.1.1 為自定義Gym環境實現創建模板 106
7.1.2 在OpenAI Gym環境中注冊自定義環境 108
7.2 創建與OpenAI Gym兼容的CARLA環境 108
7.2.1 配置和初始化 110
7.2.2 實現reset方法 111
7.2.3 為CARLA環境實現step函數 115
7.2.4 測試CARLA Gym環境 120
7.3 小結 122
第8章 用深度演員-評論家算法實現無人駕駛智能體 123
8.1 深度n步優勢演員-評論家算法 123
8.1.1 策略梯度 124
8.1.2 演員-評論家算法 126
8.1.3 優勢演員-評論家算法 127
8.1.4 n步優勢演員-評論家算法 129
8.1.5 深度n步優勢演員-評論家算法 132
8.2 實現深度n步優勢演員-評論家智能體 133
8.2.1 初始化演員和評論家網絡 133
8.2.2 用當前策略獲取n步經驗 137
8.2.3 計算演員和評論家的損失 137
8.2.4 更新演員-評論家模型 139
8.2.5 用于保存/加載、記錄、可視化和監視的工具 139
8.2.6 擴展——異步深度n步優勢演員-評論家 139
8.3 訓練一個“聰明”的自動駕駛智能體 140
8.3.1 訓練和測試深度n步優勢演員-評論家智能體 140
8.3.2 訓練智能體在CARLA中駕駛車輛 143
8.4 小結 144
第9章 探索學習環境全景——Roboschool、Gym Retro、StarCraft-Ⅱ和DeepMind Lab 145
9.1 Gym接口兼容的環境 146
9.1.1 Roboschool 146
9.1.2 Gym Retro 150
9.2 其他基于Python的開源學習環境 153
9.2.1 星際爭霸Ⅱ—PySC2 153
9.2.2 DeepMind Lab 156
9.3 小結 160
第 10章 探索學習算法世界——DDPG(演員-評論家)、PPO (策略梯度)、Rainbow(基于值) 161
10.1 深度確定性策略梯度 162
10.2 近端策略優化 163
10.3 Rainbow 165
10.3.1 核心概念 165
10.3.2 優點及應用簡要總結 169
10.4 小結 170
展開全部

深度強化學習實戰 用OPENAI GYM構建智能體 作者簡介

普拉文·巴拉尼沙米(Praveen Palanisamy)專注于研究自主智能系統。他是通用汽車研發部門的 AI(人工智能)研究員,主要負責針對自動駕駛開發基于深度強化學習的規劃和決策算法。在此之前,他在卡內基-梅隆大學機器人所從事自動導航的研究(包括可移動機器人的感知與智能),曾從零開始研發一個完整的、自動的機器人系統。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | 软装设计-提供软装装饰和软装配饰及软装陈设的软装设计公司 | 北京三友信电子科技有限公司-ETC高速自动栏杆机|ETC机柜|激光车辆轮廓测量仪|嵌入式车道控制器 | 中医中药治疗血小板减少-石家庄血液病肿瘤门诊部 | 27PR跨境电商导航 | 专注外贸跨境电商 | 高效节能电机_伺服主轴电机_铜转子电机_交流感应伺服电机_图片_型号_江苏智马科技有限公司 | 中央空调维修、中央空调保养、螺杆压缩机维修-苏州东菱空调 | 恒压供水控制柜|无负压|一体化泵站控制柜|PLC远程调试|MCGS触摸屏|自动控制方案-联致自控设备 | 短信群发平台_群发短信软件_短信营销-讯鸽科技 | 防爆电机_防爆电机型号_河南省南洋防爆电机有限公司 | 灌木树苗-绿化苗木-常绿乔木-价格/批发/基地 - 四川成都途美园林 | 二手电脑回收_二手打印机回收_二手复印机回_硒鼓墨盒回收-广州益美二手电脑回收公司 | 税筹星_灵活用工平台_企业财务顾问_财税法薪综合服务平台 | 半自动预灌装机,卡式瓶灌装机,注射器灌装机,给药器灌装机,大输液灌装机,西林瓶灌装机-长沙一星制药机械有限公司 | 二手色谱仪器,十万分之一分析天平,蒸发光检测器,电位滴定仪-湖北捷岛科学仪器有限公司 | 中式装修设计_全屋定制家具_实木仿古门窗花格厂家-喜迎门 | 气动球阀_衬氟蝶阀_调节阀_电动截止阀_上海沃托阀门有限公司 | 破碎机锤头_耐磨锤头_合金锤头-鼎成机械一站式耐磨铸件定制服务 微型驱动系统解决方案-深圳市兆威机电股份有限公司 | 齿轮减速机电机一体机_齿轮减速箱加电机一体化-德国BOSERL蜗轮蜗杆减速机电机生产厂家 | 3A别墅漆/3A环保漆_广东美涂士建材股份有限公司【官网】 | 翅片管散热器价格_钢制暖气片报价_钢制板式散热器厂家「河北冀春暖气片有限公司」 | 塑料薄膜_PP薄膜_聚乙烯薄膜-常州市鑫美新材料包装厂 | 气密性检测仪_气密性检测设备_防水测试仪_密封测试仪-岳信仪器 | HYDAC过滤器,HYDAC滤芯,现货ATOS油泵,ATOS比例阀-东莞市广联自动化科技有限公司 | 浙江皓格药业有限公司| 安驭邦官网-双向万能直角铣头,加工中心侧铣头,角度头[厂家直销] 闸阀_截止阀_止回阀「生产厂家」-上海卡比阀门有限公司 | bng防爆挠性连接管-定做金属防爆挠性管-依客思防爆科技 | Akribis直线电机_直线模组_力矩电机_直线电机平台|雅科贝思Akribis-杭州摩森机电科技有限公司 | 三价铬_环保铬_环保电镀_东莞共盈新材料贸易有限公司 | PTFE接头|聚四氟乙烯螺丝|阀门|薄膜|消解罐|聚四氟乙烯球-嘉兴市方圆氟塑制品有限公司 | H型钢切割机,相贯线切割机,数控钻床,数控平面钻,钢结构设备,槽钢切割机,角钢切割机,翻转机,拼焊矫一体机 | 聚合氯化铝价格_聚合氯化铝厂家_pac絮凝剂-唐达净水官网 | 塑料瓶罐_食品塑料瓶_保健品塑料瓶_调味品塑料瓶–东莞市富慷塑料制品有限公司 | 青岛侦探_青岛侦探事务所_青岛劝退小三_青岛调查出轨取证公司_青岛婚外情取证-青岛探真调查事务所 | 济南轻型钢结构/济南铁艺护栏/济南铁艺大门-济南燕翔铁艺制品有限公司 | 全自动在线分板机_铣刀式在线分板机_曲线分板机_PCB分板机-东莞市亿协自动化设备有限公司 | 澳门精准正版免费大全,2025新澳门全年免费,新澳天天开奖免费资料大全最新,新澳2025今晚开奖资料,新澳马今天最快最新图库 | 样品瓶(色谱样品瓶)百科-浙江哈迈科技有限公司 | 酒精检测棒,数显温湿度计,酒安酒精测试仪,酒精检测仪,呼气式酒精检测仪-郑州欧诺仪器有限公司 | 雪花制冰机(实验室雪花制冰机)百科 | 吲哚菁绿衍生物-酶底物法大肠菌群检测试剂-北京和信同通科技发展有限公司 |