中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
揭秘深度強化學習

包郵 揭秘深度強化學習

作者:彭偉編著
出版社:中國水利水電出版社出版時間:2018-05-01
開本: 16開 頁數: 360
中 圖 價:¥59.4(6.6折) 定價  ¥89.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

揭秘深度強化學習 版權信息

  • ISBN:9787517062387
  • 條形碼:9787517062387 ; 978-7-5170-6238-7
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

揭秘深度強化學習 本書特色

深度強化學習(Deep Reinforcement Learning,DRL)是深度學習算法和強化學習算法的巧妙結合,它是一種新興的通用人工智能算法技術,也是機器學習的前沿技術,DRL 算法潛力無限,AlphaGo 是目前該算法*成功的使用案例。DRL 算法以馬爾科夫決策過程為基礎,是在深度學習強大的非線性函數的擬合能力下構成的一種增強算法。深度強化學習算法主要包括基于動態規劃(DP)的算法以及基于策略優化的算法,本書的目的就是要把這兩種主要的算法(及設計技巧)講解清楚,使算法研究人員能夠熟練地掌握。 《揭秘深度強化學習人工智能機器學習技術叢書》共10 章,首先以AlphaGo 在圍棋大戰的偉大事跡開始,引起對人工智能發展和現狀的介紹,進而介紹深度強化學習的基本知識。然后分別介紹了強化學習(重點介紹蒙特卡洛算法和時序差分算法)和深度學習的基礎知識、功能神經網絡層、卷積神經網絡(CNN)、循環神經網絡(RNN),以及深度強化學習的理論基礎和當前主流的算法框架。*后介紹了深度強化學習在不同領域的幾個應用實例。引例、基礎知識和實例相結合,方便讀者理解和學習。 《揭秘深度強化學習 人工智能機器學習技術叢書》內容豐富,講解全面、語言描述通俗易懂,是深度強化學習算法入門的*選擇。本書適合計算機專業本科相關學生、人工智能領域的研究人員以及所有對機器學習和人工智能算法感興趣的人員。

揭秘深度強化學習 內容簡介

《揭秘深度強化學習 人工智能機器學習技術叢書》是一本詳細介紹深度強化學習算法的入門類圖書,涉及深度學習和強化學習的相關內容,是人工智能*前沿的研究方向。非常適合想在下一代技術領域立足的人工智能和機器學習算法從業者學習和參考。 機器學習的一個分支是神經網絡;神經網絡模擬人的大腦,形成神經網絡模型,它可以包括很多層次,一般來講層次越深學習效果越好,很多層的神經網絡就是深度學習。 在傳統的機器學習中,主要分為非監督學習(unsupervised learning)、監督學習(supervised leaning)和強化學習。強化學習是對決策的學習,簡單來講,強化學習就是用獎勵機制,自己調節參數,讓算法越來越聰明。 深度強化學習,研究的是如何通過深度學習的方法來解決強化學習的問題。也就是深度學習和強化學習的結合。 《揭秘深度強化學習 人工智能機器學習技術叢書》一書囊括了強化學習基礎知識、馬爾科夫決策過程、無模型強化學習、模仿學習、深度學習基礎知識、神經網絡基本組成、反向傳播算法、功能神經網絡層、循環神經網絡、卷積神經網絡(CNN)的基礎和結構、循環神經網絡(RNN)、深度強化學習基礎、蒙特卡洛搜索樹、策略梯度算法、深度強化學習算法框架、深度Q學習、雙Q學習、異步優越性策略子-評價算法、深度強化學習應用實例等。 深度強化學習算法可應用于量化投資、游戲智能、機器人決策、自動駕駛、無人機等。

揭秘深度強化學習 目錄

第1章 深度強化學習概覽 1.1 什么是深度強化學習? 1.1.1 俯瞰強化學習 1.1.2 來一杯深度學習 1.1.3 Hello,深度強化學習 1.2 深度強化學習的學習策略 1.3 本書的內容概要 參考文獻 第2章 強化學習基礎 2.1 真相--經典的隱馬爾科夫模型(HMM) 2.1.1 HMM引例 2.1.2 模型理解與推導 2.1.3 隱馬爾科夫應用舉例 2.2 逢考必過—馬爾科夫決策過程(MDP) 2.2.1 MDP生活化引例 2.2.2 MDP模型 2.2.3 MDP模型引例 2.2.4 模型理解 2.2.5 探索與利用 2.2.6 值函數和動作值函數 2.2.7 基于動態規劃的強化問題求解 2.3 糟糕,考試不給題庫—無模型強化學習 2.3.1 蒙特卡洛算法 2.3.2 時序差分算法 2.3.3 異步強化學習算法 2.4 學霸來了--強化學習之模仿學習 2.4.1 模仿學習(Imitation Learning) 2.4.2 逆強化學習 本章總結 參考 第3章 深度學習基礎 3.1 深度學習簡史 3.1.1 神經網絡發展史 3.1.2 深度學習的分類 3.1.3 深度學習的應用 3.1.4 深度學習存在的問題 3.2 深度學習基礎概念 3.2.1 深度學習總體感知 3.2.2 神經網絡的基本組成 3.2.3 深度學習訓練 3.2.4 梯度下降法 3.2.5 反向傳播算法(BP) 3.3 數據預處理 3.3.1 主成分分析(PCA) 3.3.2 獨立成分分析(ICA) 3.3.3 數據白化處理 3.4 深度學習硬件基礎 3.4.1 深度學習硬件基礎 3.4.2 GPU簡介 3.4.3 CUDA編程 本章總結 參考 第4章 功能神經網絡層 4.1 激活函數單元 4.2 池化層Pooling layer 4.3 參數開關Dropout 4.4 批量歸一化層(Batch normalization layer) 4.5 全連接層 4.6 卷積神經網絡 4.7 全卷積神經網絡 4.8 循環(遞歸)神經網絡(RNN) 4.9 深度學習的 本章總結 參考 第5章 卷積神經網絡(CNN) 5.1 卷積神經網絡 CNN 基礎 5.1.1 卷積神經網絡的歷史 5.1.2 卷積神經網絡的核心 5.2 卷積神經網絡 CNN 結構 5.2.1 深度卷積神經網絡CNN 5.2.2 深度卷積神經網絡CNN可視化 5.3 經典卷積神經網絡架構分析 5.3.1 一切的開始--LeNet 5.3.2 王者回歸--AlexNet 5.3.3 起飛的時候--VGG 5.3.4 致敬經典GoogLeNet 5.3.5 沒有*深只有更深--ResNet 5.4 對抗網絡 5.4.1 對抗網絡(GAN) 5.4.2 WGAN 5.5 RCNN 5.6 CNN的應用實例 本章總結 參考 第6章 循環神經網絡(RNN) 6.1 RNN概覽 6.2 長期依賴(Long-Term Dependencies)問題 6.3 LSTM 的變體 本章總結 參考 第7章:如何寫自己的CNN—C語言實現深度學習 7.1 如何寫自己的CMake文件 7.2 如何寫自己神經網絡 7.2.1 激活函數 7.2.2 池化函數 7.2.3 全連接層 7.3 卷積神經網絡 7.3.1 CNN網絡的構建 7.3.2 CNN前向傳播 7.3.3 CNN的反向傳播 7.4 文件解析 本章總結 第8章 深度強化學習 8.1 初識深度強化學習 8.1.1 深度強化學習概覽 8.1.2 記憶回放(Memory-Replay)機制 8.1.3 蒙特卡羅搜索樹 8.2 深度強化學習(DRL)中的值函數算法 8.2.1 DRL中值函數的作用 8.2.2 DRL中值函數理論推導 8.3 深度強化學習中的策略梯度(Policy Gradient) 8.3.1 策略梯度的作用和優勢 8.3.2 策略梯度的理論推導 8.3.3 REINFORCE算法 8.3.4 策略梯度的優化算法 8.3.5 策略子-評判算法(Actor-Critic) 8.4 深度強化學習網絡結構 參考 第9章 深度強化學習算法框架 9.1 深度Q學習 9.2 雙Q學習 9.3 異步深度強化學習 9.4 異步優越性策略子-評價算法 9.5 DDPG 算法: 9.6 值迭代網絡 本章總結 參考 第10章 深度強化學習應用實例 10.1 Flappy Bird 應用 10.2 Play Pong 應用 10.3 深度地形-自適應應用(Deep Terrain-adaptive應用) 10.4 AlphaGo 254 10.4.1 獨立算法的研究部分 10.4.2 AlphaGo算法 本章總結 參考 附錄: 常用的深度學習框架 F.1. 谷歌TensorFlow F.1.1 TensorFlow 簡介 F.1.2 TensorFlow 基礎 F.2 輕量級MXNet F.2.1 MXnet介紹 F.2.2 MXnet基礎 F.3 來至UCLA 的Caffe F.3.1 Caffe 簡介 F3.2 Caffe基礎 F.4 悠久的 Theano F.4.1 Theano簡介 F.4.2 Theano基礎 F.5 30s 入門的Keras 參考
展開全部

揭秘深度強化學習 作者簡介

彭偉,AvatarWorks人工智能實驗室研究員,電子科技大學EE學士,廈門大學計算機碩士,具有良好的軟硬件能力。目前主要從事人工智能、機器學習算法的研究。主要的項目經歷包括視覺目標跟蹤、行人檢測、目標檢測、3D動畫風格傳輸、虛擬機器人行為系統等,具有豐富的實戰經驗。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: cnc精密加工_数控机械加工_非标平键定制生产厂家_扬州沃佳机械有限公司 | 鑫达滑石-辽宁鑫达滑石集团| 变频器维修公司_plc维修_伺服驱动器维修_工控机维修 - 夫唯科技 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 明渠式紫外线杀菌器-紫外线消毒器厂家-定州市优威环保 | 路斯特伺服驱动器维修,伦茨伺服驱动器维修|万骏自动化百科 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 利浦顿蒸汽发生器厂家-电蒸汽发生器/燃气蒸汽发生器_湖北利浦顿热能科技有限公司官网 | HDPE储罐_厂家-山东九州阿丽贝防腐设备 | 沈阳真空机_沈阳真空包装机_沈阳大米真空包装机-沈阳海鹞真空包装机械有限公司 | 压缩空气冷冻式干燥机_吸附式干燥机_吸干机_沪盛冷干机 | 蜘蛛车-高空作业平台-升降机-高空作业车租赁-臂式伸缩臂叉装车-登高车出租厂家 - 普雷斯特机械设备(北京)有限公司 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 真空乳化机-灌装封尾机-首页-温州精灌| 耐高温风管_耐高温软管_食品级软管_吸尘管_钢丝软管_卫生级软管_塑料波纹管-东莞市鑫翔宇软管有限公司 | 众品家具网-家具品牌招商_家具代理加盟_家具门户的首选网络媒体。 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 真空上料机(一种真空输送机)-百科| 深圳品牌设计公司-LOGO设计公司-VI设计公司-未壳创意 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 双吸泵,双吸泵厂家,OS双吸泵-山东博二泵业有限公司 | Eiafans.com_环评爱好者 环评网|环评论坛|环评报告公示网|竣工环保验收公示网|环保验收报告公示网|环保自主验收公示|环评公示网|环保公示网|注册环评工程师|环境影响评价|环评师|规划环评|环评报告|环评考试网|环评论坛 - Powered by Discuz! | 上海皓越真空设备有限公司官网-真空炉-真空热压烧结炉-sps放电等离子烧结炉 | 产业规划_产业园区规划-产业投资选址及规划招商托管一体化服务商-中机院产业园区规划网 | 氧化锆陶瓷_氧化锆陶瓷加工_氧化锆陶瓷生产厂家-康柏工业陶瓷有限公司 | 沈飞防静电地板__机房地板-深圳市沈飞防静电设备有限公司 | 全自动烧卖机厂家_饺子机_烧麦机价格_小笼汤包机_宁波江北阜欣食品机械有限公司 | 广东健伦体育发展有限公司-体育工程配套及销售运动器材的体育用品服务商 | 亮点云建站-网站建设制作平台| CTAB,表面活性剂1631溴型(十六烷基三甲基溴化铵)-上海升纬化工原料有限公司 | 带式压滤机_污泥压滤机_污泥脱水机_带式过滤机_带式压滤机厂家-河南恒磊环保设备有限公司 | 北京燃气公司 用户服务中心| 压接机|高精度压接机|手动压接机|昆明可耐特科技有限公司[官网] 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | 清水混凝土修复_混凝土色差修复剂_混凝土色差调整剂_清水混凝土色差修复_河南天工 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 滚筒烘干机_转筒烘干机_滚筒干燥机_转筒干燥机_回转烘干机_回转干燥机-设备生产厂家 | 东莞猎头公司_深圳猎头公司_广州猎头公司-广东万诚猎头提供企业中高端人才招聘服务 | 发光字|标识设计|标牌制作|精神堡垒 - 江苏苏通广告有限公司 | 双菱电缆-广州电缆厂_广州电缆厂有限公司 | 旋片真空泵_真空泵_水环真空泵_真空机组-深圳恒才机电设备有限公司 | 胜为光纤光缆_光纤跳线_单模尾纤_光纤收发器_ODF光纤配线架厂家直销_北京睿创胜为科技有限公司 - 北京睿创胜为科技有限公司 | 湖南自考_湖南自学考试网|