中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
Python深度強化學習入門:強化學習和深度學習的搜索與控制

包郵 Python深度強化學習入門:強化學習和深度學習的搜索與控制

出版社:機械工業出版社出版時間:2022-04-01
開本: 16開 頁數: 240
中 圖 價:¥66.0(7.4折) 定價  ¥89.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Python深度強化學習入門:強化學習和深度學習的搜索與控制 版權信息

Python深度強化學習入門:強化學習和深度學習的搜索與控制 本書特色

適讀人群 :人工智能、機器學習、深度學習相關專業領域的技術人員和愛好者《Python深度強化學習入門:強化學習和深度學習的搜索與控制》特點: 以上手實操介紹為主,可操作性強 從基礎開始介紹深度強化學習的概念及算法 通過多個典型的實際問題,剖析深度強化學習的具體實現方法

Python深度強化學習入門:強化學習和深度學習的搜索與控制 內容簡介

《Python深度強化學習入門:強化學習和深度學習的搜索與控制》共7章。其中,第1章介紹了機器學習的分類、強化學習的學習機制以及深度強化學習的概念;第2章通過強化學習的基本概念、馬爾科夫決策過程和貝爾曼方程、貝爾曼方程的求解方法、無模型控制等介紹了強化學習的基本算法;第3章通過深度學習、卷積神經網絡(CNN)、循環神經網絡(RNN)介紹了強化學習中深度學習的特征提取方法;第4章通過行動價值函數的網絡表示、策略函數的網絡表示介紹了深度強化學習的實現;第5章通過策略梯度法的連續控制、學習算法和策略模型等,詳細介紹了深度強化學習在連續控制問題中的應用及具體實現;第6章通過巡回推銷員問題和魔方問題詳細介紹了深度強化學習在組合優化中的應用及具體實現;第7章通過SeqGAN的文本生成和神經網絡的架構搜索詳細介紹了深度強化學習在時間序列數據生成的應用。在附錄中還給出了Colaboratory和Docker等深度強化學習開發環境的構建。

Python深度強化學習入門:強化學習和深度學習的搜索與控制 目錄

目 錄 譯者序 原書前言 閱讀本書需要的知識基礎 本書的結構 本書示例的運行環境 1.1 機器學習的分類004 1.1.1 監督學習005 1.1.2 無監督學習006 1.1.3 強化學習007 1.2 強化學習的學習機制008 1.3 深度強化學習011 2.1 強化學習的基本概念014 2.1.1 強化學習的問題設定014 2.1.2 強化學習的機制014 2.1.3 關于本章的內容016 2.2 馬爾可夫決策過程和貝爾曼方程017 2.2.1 馬爾可夫決策過程017 2.2.2 貝爾曼方程020 2.3 貝爾曼方程的求解方法024 2.3.1 動態規劃法024 2.3.2 蒙特卡洛法031 2.3.3 TD學習法033 2.4 無模型控制037 2.4.1 策略改進的方法037 2.4.2 基于價值的方法038 2.4.3 基于策略的方法043 2.4.4 Actor-Critic法049 3.1 深度學習056 3.1.1 深度學習的出現和背景056 3.1.2 什么是深度學習?056 3.1.3 深度學習平臺062 3.2 CNN067 3.2.1 什么是CNN067 3.2.2 CNN的應用071 3.3 RNN074 3.3.1 什么是RNN074 3.3.2 什么是LSTM079 3.3.3 RNN的應用081 4.1 深度強化學習的發展086 4.1.1 DQN的出現086 4.1.2 用于強化學習的模擬器086 4.2 行動價值函數的網絡表示089 4.2.1 DQN算法089 4.2.2 DQN算法的實現092 4.2.3 學習結果099 4.3 策略函數的網絡表示101 4.3.1 Actor的實現101 4.3.2 Critic的實現101 4.3.3 示例代碼的介紹102 4.3.4 學習結果108 5.1 策略梯度法的連續控制114 5.1.1 連續控制114 5.1.2 策略梯度法學習114 5.2 學習算法和策略模型117 5.2.1 算法概況117 5.2.2 REINFORCE算法118 5.2.3 基準函數的引入118 5.2.4 高斯模型的策略概率119 5.3 連續行動模擬器121 5.3.1 pybullet-gym121 5.3.2 Walker2D122 5.4 算法的實現126 5.4.1 算法實現的總體構成126 5.4.2 train.py127 5.4.3 policy_estimator.py129 5.4.4 value_estimator.py132 5.5 學習結果及預測控制134 5.5.1 學習結果134 5.5.2 預測控制的結果136 5.5.3 其他環境模型的應用137 5.5.4 總結140 6.1 組合優化中的應用144 6.1.1 關于組合優化144 6.2 巡回推銷員問題145 6.2.1 通過強化學習解決巡回推銷員問題145 6.2.2 實現概要147 6.2.3 運行結果155 6.2.4 今后的發展趨勢157 6.3 魔方問題158 6.3.1 用強化學習解決魔方問題158 6.3.2 實現概要161 6.3.3 實現結果171 6.3.4 AC+MCTS算法的預測結果173 6.3.5 今后的發展趨勢177 6.4 總結179 7.1 根據SeqGAN的文本生成182 7.1.1 GAN182 7.1.2 SeqGAN183 7.1.3 輸入數據185 7.1.4 使用的算法及其實現187 7.1.5 實現結果195 7.1.6 總結198 7.2 神經網絡架構的搜索198 7.2.1 神經體系結構搜索198 7.2.2 語義分割199 7.2.3 U-Net200 7.2.4 文件目錄結構201 7.2.5 輸入數據201 7.2.6 所使用的算法204 7.2.7 實現結果213 7.2.8 總結215 附錄A Colaboratory的GPU環境構建218 A.1 Colaboratory218 A.2 Colaboratory的使用方法218 附錄B 通過Docker進行Windows環境的構建222 B.1 介紹222 B.2 Docker的安裝222 B.3 Docker映像的創建228 B.4 容器的啟動232 B.5 運行情況的查看234 參考文獻238
展開全部

Python深度強化學習入門:強化學習和深度學習的搜索與控制 作者簡介

  [日]伊藤多一,1995年在名古屋大學理學研究所完成博士課程,井獲得博士學位。后一直從事粒子物理學研究,直到2004年3月。同年,加入了一家專門從事合同數據分析的風險公司,井參與了多個數據分析項目。自2013年以來,他一直在BrainPad公司從事機器學習的廣告效果分析工作。自2016年以來,通過深度學習參與了圖像分析項目。 今津義充,博士學位(理學),熟悉統計分析、模型構建以及基于數值分析的基本粒子和核物理研究。自2013年以來,領導了BrainPad公司的定量分析項目,例如需求預測和數學優化等。近年來,一直從事利用深度學習技術的項目分析和應用研究。 須藤廣大,在奈良科學技術學院主修自然語言處理,獲得碩士學位(信息工程)。后以新畢業生的身份加入BrainPad公司,井以機器學習工程師的身份從事與深度學習相關的項目分析和開發。 仁平將人,碩士學位,在研究生院主修管理系統工程專業,于2018年加入BrainPad公司成為數據科學家。加入公司后,從事有關強化學習和自然語言處理的項目。 川崎悠介,碩士學位,大學期間主修信息工程,并于2018年加入BrainPad公司。從事圖像識別和時間序列預測的相關項目研究。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 郑州大巴车出租|中巴车租赁|旅游大巴租车|包车|郑州旅游大巴车租赁有限公司 | 档案密集架,移动密集架,手摇式密集架,吉林档案密集架-厂家直销★价格公道★质量保证 | 厚壁钢管-厚壁无缝钢管-小口径厚壁钢管-大口径厚壁钢管 - 聊城宽达钢管有限公司 | 黄石东方妇产医院_黄石妇科医院哪家好_黄石无痛人流医院 | 临海涌泉蜜桔官网|涌泉蜜桔微商批发代理|涌泉蜜桔供应链|涌泉蜜桔一件代发 | 螺杆真空泵_耐腐蚀螺杆真空泵_水环真空泵_真空机组_烟台真空泵-烟台斯凯威真空 | 济南冷库安装-山东冷库设计|建造|冷库维修-山东齐雪制冷设备有限公司 | 自动气象站_气象站监测设备_全自动气象站设备_雨量监测站-山东风途物联网 | 电动车头盔厂家_赠品头盔_安全帽批发_山东摩托车头盔—临沂承福头盔 | 污水处理设备,一体化泵站,一体化净水设备-「梦之洁环保设备厂家」 | 裹包机|裹膜机|缠膜机|绕膜机-上海晏陵智能设备有限公司 | 合肥汽车充电桩_安徽充电桩_电动交流充电桩厂家_安徽科帝新能源科技有限公司 | 南京租车,南京汽车租赁,南京包车,南京会议租车-南京七熹租车 | 河南橡胶接头厂家,河南波纹补偿器厂家,河南可曲挠橡胶软连接,河南套筒补偿器厂家-河南正大阀门 | 3D全息投影_地面互动投影_360度立体投影_水幕灯光秀 | 广东银虎 蜂窝块状沸石分子筛-吸附脱硫分子筛-萍乡市捷龙环保科技有限公司 | 电动手术床,医用护理床,led手术无影灯-曲阜明辉医疗设备有限公司 | 传动滚筒_厂家-淄博海恒机械制造厂| 石家庄小程序开发_小程序开发公司_APP开发_网站制作-石家庄乘航网络科技有限公司 | 口臭的治疗方法,口臭怎么办,怎么除口臭,口臭的原因-口臭治疗网 | 硅PU球场、篮球场地面施工「水性、环保、弹性」硅PU材料生产厂家-广东中星体育公司 | 成都办公室装修-办公室设计-写字楼装修设计-厂房装修-四川和信建筑装饰工程有限公司 | 一体化污水处理设备-一体化净水设备-「山东梦之洁水处理」 | 千斤顶,液压千斤顶-力良企业,专业的液压千斤顶制造商,shliliang.com | 桥架-槽式电缆桥架-镀锌桥架-托盘式桥架 - 上海亮族电缆桥架制造有限公司 | 压滤机-洗沙泥浆处理-压泥机-山东创新华一环境工程有限公司 | 广东燎了网络科技有限公司官网-网站建设-珠海网络推广-高端营销型外贸网站建设-珠海专业h5建站公司「了了网」 | 淘剧影院_海量最新电视剧,免费高清电影随心观看 | 厂厂乐-汇聚海量采购信息的B2B微营销平台-厂厂乐官网 | 会议会展活动拍摄_年会庆典演出跟拍_摄影摄像直播-艾木传媒 | 冷藏车-东风吸污车-纯电动环卫车-污水净化车-应急特勤保障车-程力专汽厂家-程力专用汽车股份有限公司销售二十一分公司 | 仿古建筑设计-仿古建筑施工-仿古建筑公司-汉匠古建筑设计院 | 深圳高新投三江工业消防解决方案提供厂家_服务商_园区智慧消防_储能消防解决方案服务商_高新投三江 | 厂房出租-厂房规划-食品技术-厂房设计-厂房装修-建筑施工-设备供应-设备求购-龙爪豆食品行业平台 | 浙江筋膜枪-按摩仪厂家-制造商-肩颈按摩仪哪家好-温州市合喜电子科技有限公司 | 依维柯自动挡房车,自行式国产改装房车,小型房车价格,中国十大房车品牌_南京拓锐斯特房车 - 南京拓锐斯特房车 | 广州展览制作工厂—[优简]直营展台制作工厂_展会搭建资质齐全 | 转子泵_凸轮泵_凸轮转子泵厂家-青岛罗德通用机械设备有限公司 | 山东商品混凝土搅拌楼-环保型搅拌站-拌合站-分体仓-搅拌机厂家-天宇 | 手板_手板模型制作_cnc手板加工厂-东莞天泓 | 众品地板网-地板品牌招商_地板装修设计_地板门户的首选网络媒体。 | 贴片电容-贴片电阻-二三极管-国巨|三星|风华贴片电容代理商-深圳伟哲电子 |