中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

超值優(yōu)惠券
¥50
滿100可用 有效期2天

全場(chǎng)圖書通用(淘書團(tuán)除外)

不再提示
關(guān)閉
歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)

包郵 TENSORFLOW2強(qiáng)化學(xué)習(xí)手冊(cè)

出版社:清華大學(xué)出版社出版時(shí)間:2023-12-01
開本: 其他 頁(yè)數(shù): 331
中 圖 價(jià):¥69.3(7.0折) 定價(jià)  ¥99.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車 收藏
開年大促, 全場(chǎng)包郵
?新疆、西藏除外
本類五星書更多>

TENSORFLOW2強(qiáng)化學(xué)習(xí)手冊(cè) 版權(quán)信息

TENSORFLOW2強(qiáng)化學(xué)習(xí)手冊(cè) 本書特色

通過(guò)本書,讀者可以:
l使用全新的TensorFlow和Keras API從頭開始構(gòu)建深度強(qiáng)化學(xué)習(xí)智能體;
l使用*少代碼實(shí)現(xiàn)先進(jìn)的深度強(qiáng)化學(xué)習(xí)算法;
l在模擬環(huán)境中培訓(xùn)深度強(qiáng)化學(xué)習(xí)智能體,以執(zhí)行加密貨幣、股票交易和建筑能源優(yōu)化等現(xiàn)實(shí)世界的任務(wù);
l使用TensorFlow創(chuàng)建桌面應(yīng)用程序、云服務(wù)、Web和移動(dòng)應(yīng)用程序,將強(qiáng)化學(xué)習(xí)智能體部署到云端,構(gòu)建跨平臺(tái)應(yīng)用程序;
使用分布式DNN模型訓(xùn)練加快代理開發(fā)。

TENSORFLOW2強(qiáng)化學(xué)習(xí)手冊(cè) 內(nèi)容簡(jiǎn)介

本書首先介紹深度強(qiáng)化學(xué)習(xí)的基礎(chǔ)知識(shí)以及TensorFlow 2.x的**主要版本。隨后介紹OpenAI Gym、基于模型的RL和無(wú)模型的RL,并學(xué)習(xí)如何開發(fā)基本代理。深入介紹發(fā)現(xiàn)如何實(shí)施高級(jí)深度強(qiáng)化學(xué)習(xí)算法,例如行動(dòng)者批評(píng)、深度確定性策略梯度、深度Q網(wǎng)絡(luò)、近端策略優(yōu)化以及深度循環(huán)Q網(wǎng)絡(luò),以訓(xùn)練RL代理。同時(shí),本書通過(guò)構(gòu)建用于自動(dòng)完成任務(wù)的加密貨幣交易代理,股票/股票交易代理和智能代理等實(shí)例,探索現(xiàn)實(shí)世界中的強(qiáng)化學(xué)習(xí)。*后,本書介紹如何使用TensorFlow 2.x將深度強(qiáng)化學(xué)習(xí)代理部署到云并構(gòu)建跨平臺(tái)應(yīng)用程序。

TENSORFLOW2強(qiáng)化學(xué)習(xí)手冊(cè) 目錄


第 1 章 使用 TensorFlow 2.x 開發(fā)深度強(qiáng)化學(xué)習(xí)的基本模塊 1
1.1 技術(shù)要求 1
1.2 構(gòu)建訓(xùn)練強(qiáng)化學(xué)習(xí)智能體的環(huán)境和獎(jiǎng)勵(lì)機(jī)制 1
1.2.1 前期準(zhǔn)備 2
1.2.2 實(shí)現(xiàn)步驟 2
1.2.3 工作原理 8
1.3 針對(duì)離散動(dòng)作空間和離散決策問(wèn)題實(shí)現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)策略 8
1.3.1 前期準(zhǔn)備 9
1.3.2 實(shí)現(xiàn)步驟 9
1.3.3 工作原理 13
1.4 針對(duì)連續(xù)動(dòng)作空間和連續(xù)控制問(wèn)題實(shí)現(xiàn)基于神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)策略 13
1.4.1 前期準(zhǔn)備 14
1.4.2 實(shí)現(xiàn)步驟 14
1.4.3 工作原理 19
1.5 將 OpenAI Gym 作為強(qiáng)化學(xué)習(xí)的訓(xùn)練環(huán)境 20
1.5.1 前期準(zhǔn)備 20
1.5.2 實(shí)現(xiàn)步驟 20
1.5.3 工作原理 22
1.6 構(gòu)建神經(jīng)網(wǎng)絡(luò)智能體 22
1.6.1 前期準(zhǔn)備 23
1.6.2 實(shí)現(xiàn)步驟 23
1.6.3 工作原理 26
1.7 構(gòu)建神經(jīng)網(wǎng)絡(luò)進(jìn)化智能體 27
1.7.1 前期準(zhǔn)備 27
1.7.2 實(shí)現(xiàn)步驟 27
1.7.3 工作原理 34
1.8 參考資料 34
第 2 章 基于價(jià)值、策略和行動(dòng)者-評(píng)論家的深度強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn). 35
2.1 技術(shù)要求 35
2.2 構(gòu)建用于訓(xùn)練強(qiáng)化學(xué)習(xí)智能體的隨機(jī)環(huán)境 35
2.2.1 前期準(zhǔn)備 36
2.2.2 實(shí)現(xiàn)步驟 37
2.2.3 工作原理 42
2.3 構(gòu)建基于價(jià)值的強(qiáng)化學(xué)習(xí)智能體算法 42
2.3.1 前期準(zhǔn)備 43
2.3.2 實(shí)現(xiàn)步驟 43
2.3.3 工作原理 46
2.4 實(shí)現(xiàn)時(shí)序差分學(xué)習(xí) 47
2.4.1 前期準(zhǔn)備 47
2.4.2 實(shí)現(xiàn)步驟 48
2.4.3 工作原理 52
2.5 構(gòu)建強(qiáng)化學(xué)習(xí)中的蒙特卡洛預(yù)測(cè)和控制算法 53
2.5.1 前期準(zhǔn)備 54
2.5.2 實(shí)現(xiàn)步驟 54
2.5.3 工作原理 58
2.6 實(shí)現(xiàn) SARSA 算法和對(duì)應(yīng)的強(qiáng)化學(xué)習(xí)智能體 59
2.6.1 前期準(zhǔn)備 59
2.6.2 實(shí)現(xiàn)步驟 59
2.6.3 工作原理 61
2.7 構(gòu)建基于 Q 學(xué)習(xí)的智能體 62
2.7.1 前期準(zhǔn)備 62
2.7.2 實(shí)現(xiàn)步驟 63
2.7.3 工作原理 64
2.8 實(shí)現(xiàn)策略梯度 65
2.8.1 前期準(zhǔn)備 65
2.8.2 實(shí)現(xiàn)步驟 66
2.8.3 工作原理 70
2.9 實(shí)現(xiàn)行動(dòng)者-評(píng)論家算法 70
2.9.1 前期準(zhǔn)備 70
2.9.2 實(shí)現(xiàn)步驟 71
2.9.3 工作原理 74
第 3 章 高級(jí)強(qiáng)化學(xué)習(xí)算法的實(shí)現(xiàn) 75
3.1 技術(shù)要求 75
3.2 實(shí)現(xiàn) Deep Q 學(xué)習(xí)算法、DQN 和 Double-DQN 智能體 75
3.2.1 前期準(zhǔn)備 76
3.2.2 實(shí)現(xiàn)步驟 76
3.2.3 工作原理 81
3.3 實(shí)現(xiàn) Dueling DQN 智能體 81
3.3.1 前期準(zhǔn)備 81
3.3.2 實(shí)現(xiàn)步驟 82
3.3.3 工作原理 86
3.4 實(shí)現(xiàn) Dueling Double DQN 算法和 DDDQN 智能體 86
3.4.1 前期準(zhǔn)備 87
3.4.2 實(shí)現(xiàn)步驟 87
3.4.3 工作原理 91
3.5 實(shí)現(xiàn)深度遞歸 Q 學(xué)習(xí)算法和 DRQN 智能體 91
3.5.1 前期準(zhǔn)備 91
3.5.2 實(shí)現(xiàn)步驟 92
3.5.3 工作原理 96
3.6 實(shí)現(xiàn)異步優(yōu)勢(shì)行動(dòng)者-評(píng)論家算法和 A3C 智能體 96
3.6.1 前期準(zhǔn)備 96
3.6.2 實(shí)現(xiàn)步驟 97
3.6.3 工作原理 104
3.7 實(shí)現(xiàn)近端策略優(yōu)化算法和 PPO 智能體 104
3.7.1 前期準(zhǔn)備 104
3.7.2 實(shí)現(xiàn)步驟 105
3.7.3 工作原理 112
3.8 實(shí)現(xiàn)深度確定性策略梯度算法和 DDPG 智能體 112
3.8.1 前期準(zhǔn)備 112
3.8.2 實(shí)現(xiàn)步驟 113
3.8.3 工作原理 119
第 4 章 現(xiàn)實(shí)世界中的強(qiáng)化學(xué)習(xí)——構(gòu)建加密貨幣交易智能體 120
4.1 技術(shù)要求 120
4.2 使用真實(shí)市場(chǎng)數(shù)據(jù)搭建一個(gè)比特幣交易強(qiáng)化學(xué)習(xí)平臺(tái) 120
4.2.1 前期準(zhǔn)備 121
4.2.2 實(shí)現(xiàn)步驟 121
4.2.3 工作原理 127
4.3 使用價(jià)格圖表搭建一個(gè)以太坊交易強(qiáng)化學(xué)習(xí)平臺(tái) 128
4.3.1 前期準(zhǔn)備 128
4.3.2 實(shí)現(xiàn)步驟 129
4.3.3 工作原理 135
4.4 為強(qiáng)化學(xué)習(xí)智能體搭建一個(gè)高級(jí)的加密貨幣交易平臺(tái) 135
4.4.1 前期準(zhǔn)備 135
4.4.2 實(shí)現(xiàn)步驟 136
4.4.3 工作原理 140
4.5 使用強(qiáng)化學(xué)習(xí)訓(xùn)練一個(gè)加密貨幣交易智能體 141
4.5.1 前期準(zhǔn)備 141
4.5.2 實(shí)現(xiàn)步驟 141
4.5.3 工作原理 153
第 5 章 現(xiàn)實(shí)世界中的強(qiáng)化學(xué)習(xí)——建立股票/股份交易智能體 154
5.1 技術(shù)要求 154
5.2 使用真實(shí)的證券交易所數(shù)據(jù)搭建一個(gè)股票市場(chǎng)交易強(qiáng)化學(xué)習(xí)平臺(tái) 155
5.2.1 前期準(zhǔn)備 155
5.2.2 實(shí)現(xiàn)步驟 155
5.2.3 工作原理 159
5.3 使用價(jià)格圖表搭建一個(gè)股票市場(chǎng)交易強(qiáng)化學(xué)習(xí)平臺(tái) 159
5.3.1 前期準(zhǔn)備 160
5.3.2 實(shí)現(xiàn)步驟 160
5.3.3 工作原理 165
5.4 搭建一個(gè)高級(jí)的股票交易強(qiáng)化學(xué)習(xí)平臺(tái)以訓(xùn)練智能體模仿專業(yè)交易員 165
5.4.1 前期準(zhǔn)備 165
5.4.2 實(shí)現(xiàn)步驟 166
5.4.3 工作原理 171
第 6 章 現(xiàn)實(shí)世界中的強(qiáng)化學(xué)習(xí)——構(gòu)建智能體來(lái)完成您的待辦事項(xiàng) 173
6.1 技術(shù)要求 173
6.2 為現(xiàn)實(shí)世界的強(qiáng)化學(xué)習(xí)搭建學(xué)習(xí)環(huán)境 174
6.2.1 前期準(zhǔn)備 174
6.2.2 實(shí)現(xiàn)步驟 174
6.2.3 工作原理 181
6.3 構(gòu)建一個(gè)強(qiáng)化學(xué)習(xí)智能體來(lái)完成網(wǎng)絡(luò)上的任務(wù)——行動(dòng)號(hào)召 181
6.3.1 前期準(zhǔn)備 182
6.3.2 實(shí)現(xiàn)步驟 182
6.3.3 工作原理 192
6.4 構(gòu)建一個(gè)用于可視化頁(yè)面的自動(dòng)登錄機(jī)器人 193
6.4.1 前期準(zhǔn)備 194
6.4.2 實(shí)現(xiàn)步驟 194
6.4.3 工作原理 202
6.5 訓(xùn)練一個(gè)強(qiáng)化學(xué)習(xí)智能體來(lái)自動(dòng)為您的行程預(yù)訂航班 203
6.5.1 前期準(zhǔn)備 203
6.5.2 實(shí)現(xiàn)步驟 204
6.5.3 工作原理 211
6.6 訓(xùn)練一個(gè)強(qiáng)化學(xué)習(xí)智能體來(lái)管理您的電子郵件 212
6.6.1 前期準(zhǔn)備 212
6.6.2 實(shí)現(xiàn)步驟 213
6.6.3 工作原理 217
6.7 訓(xùn)練一個(gè)強(qiáng)化學(xué)習(xí)智能體來(lái)自動(dòng)管理您的社交媒體賬戶 218
6.7.1 前期準(zhǔn)備 218
6.7.2 實(shí)現(xiàn)步驟 219
6.7.3 工作原理 226
第 7 章 在云端部署深度強(qiáng)化學(xué)習(xí)智能體 228
7.1 技術(shù)要求 228
7.2 實(shí)現(xiàn)強(qiáng)化學(xué)習(xí)智能體的運(yùn)行組件 228
7.2.1 前期準(zhǔn)備 229
7.2.2 實(shí)現(xiàn)步驟 229
7.2.3 工作原理 234
7.3 建立強(qiáng)化學(xué)習(xí)環(huán)境模擬器的服務(wù) 234
7.3.1 前期準(zhǔn)備 235
7.3.2 實(shí)現(xiàn)步驟 235
7.3.3 工作原理 241
7.4 使用遠(yuǎn)程模擬服務(wù)器訓(xùn)練強(qiáng)化學(xué)習(xí)智能體 242
7.4.1 前期準(zhǔn)備 242
7.4.2 實(shí)現(xiàn)步驟 242
7.4.3 工作原理 246
7.5 測(cè)試/評(píng)估強(qiáng)化學(xué)習(xí)智能體 246
7.5.1 前期準(zhǔn)備 247
7.5.2 實(shí)現(xiàn)步驟 247
7.5.3 工作原理 250
7.6 組裝強(qiáng)化學(xué)習(xí)智能體進(jìn)行部署——一個(gè)交易機(jī)器人 250
7.6.1 前期準(zhǔn)備 251
7.6.2 實(shí)現(xiàn)步驟 251
7.6.3 工作原理 256
7.7 將強(qiáng)化學(xué)習(xí)智能體部署到云端——交易機(jī)器人即服務(wù) 256
7.7.1 前期準(zhǔn)備 257
7.7.2 實(shí)現(xiàn)步驟 257
7.7.3 工作原理 259
第 8 章 使用分布式訓(xùn)練加速深度強(qiáng)化學(xué)習(xí)智能體開發(fā) 261
8.1 技術(shù)要求 261
8.2 使用 TensorFlow 2.x 的分布式深度學(xué)習(xí)模型——多 GPU 訓(xùn)練 261
8.2.1 前期準(zhǔn)備 262
8.2.2 實(shí)現(xiàn)步驟 262
8.2.3 工作原理 268
8.3 縱向擴(kuò)展與橫向擴(kuò)展——多機(jī)、多 GPU 訓(xùn)練 268
8.3.1 前期準(zhǔn)備 269
8.3.2 實(shí)現(xiàn)步驟 269
8.3.3 工作原理 272
8.4 大規(guī)模訓(xùn)練深度強(qiáng)化學(xué)習(xí)智能體——多 GPU PPO 智能體 272
8.4.1 前期準(zhǔn)備 272
8.4.2 實(shí)現(xiàn)步驟 272
8.4.3 工作原理 284
8.5 為加速訓(xùn)練的分布式深度強(qiáng)化學(xué)習(xí)的基礎(chǔ)模塊 284
8.5.1 前期準(zhǔn)備 284
8.5.2 實(shí)現(xiàn)步驟 285
8.5.3 工作原理 290
8.6 使用 Ray、Tune 和 RLLib 進(jìn)行大規(guī)模的深度強(qiáng)化學(xué)習(xí)智能體訓(xùn)練 291
8.6.1 前期準(zhǔn)備 291
8.6.2 實(shí)現(xiàn)步驟 291
8.6.3 工作原理 296
第 9 章 深度強(qiáng)化學(xué)習(xí)智能體的多平臺(tái)部署 297
9.1 技術(shù)要求 297
9.2 使用 TensorFlow Lite 組裝用于移動(dòng)和物聯(lián)網(wǎng)設(shè)備的深度強(qiáng)化學(xué)習(xí)智能體 297
9.2.1 前期準(zhǔn)備 298
9.2.2 實(shí)現(xiàn)步驟 298
9.2.3 工作原理 303
9.3 在移動(dòng)設(shè)備上部署強(qiáng)化學(xué)習(xí)智能體 304
9.3.1 前期準(zhǔn)備 305
9.3.2 實(shí)現(xiàn)步驟 306
9.3.3 工作原理 313
9.4 使用 TensorFlow.js 為 Web 和 Node.js 組裝深度強(qiáng)化學(xué)習(xí)智能體 313
9.4.1 前期準(zhǔn)備 313
9.4.2 實(shí)現(xiàn)步驟 314
9.4.3 工作原理 318
9.5 將深度強(qiáng)化學(xué)習(xí)智能體部署為服務(wù) 318
9.5.1 前期準(zhǔn)備 319
9.5.2 實(shí)現(xiàn)步驟 319
9.5.3 工作原理 323
9.6 為跨平臺(tái)部署組裝深度強(qiáng)化學(xué)習(xí)智能體 323
9.6.1 前期準(zhǔn)備 323
9.6.2 實(shí)現(xiàn)步驟 324
9.6.3 工作原理 330
展開全部

TENSORFLOW2強(qiáng)化學(xué)習(xí)手冊(cè) 作者簡(jiǎn)介

陳翔,中山大學(xué)電子與信息工程學(xué)院教授,電子與信息工程實(shí)驗(yàn)教學(xué)中心副主任,深圳清華大學(xué)研究院兼職主任研究員,深圳空天通信終端應(yīng)用技術(shù)工程實(shí)驗(yàn)室副主任。主要研究方向?yàn)?G移動(dòng)通信與網(wǎng)絡(luò)、衛(wèi)星通信、軟件無(wú)線電,在國(guó)內(nèi)外知名期刊和會(huì)議上發(fā)表論文80余篇,獲授權(quán)發(fā)明專利40余項(xiàng),獲2017年度中國(guó)電子學(xué)會(huì)優(yōu)秀科技工作者稱號(hào)。
王璽鈞,中山大學(xué)電子與信息工程學(xué)院副教授。主要研究方向包括智能物聯(lián)網(wǎng)、無(wú)人機(jī)通信和群智學(xué)習(xí),發(fā)表論文90余篇,參撰著作1部,獲授權(quán)發(fā)明專利40余項(xiàng)。

商品評(píng)論(0條)
暫無(wú)評(píng)論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網(wǎng)
在線客服
主站蜘蛛池模板: 工控机-工业平板电脑-研华工控机-研越无风扇嵌入式box工控机 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 集装箱展厅-住人集装箱住宿|建筑|房屋|集装箱售楼处-山东锐嘉科技工程有限公司 | 亿立分板机_曲线_锯片式_走刀_在线式全自动_铣刀_在线V槽分板机-杭州亿协智能装备有限公司 | 浙江富广阀门有限公司 | 广东成考网-广东成人高考网 | 医疗仪器模块 健康一体机 多参数监护仪 智慧医疗仪器方案定制 血氧监护 心电监护 -朗锐慧康 | 智慧物联网行业一站式解决方案提供商-北京东成基业 | 冷水机-工业冷水机-冷水机组-欧科隆品牌保障 | 昆山新莱洁净应用材料股份有限公司-卫生级蝶阀,无菌取样阀,不锈钢隔膜阀,换向阀,离心泵 | 蒸压釜-陶粒板隔墙板蒸压釜-山东鑫泰鑫智能装备有限公司 | 广州网站建设_小程序开发_番禺网站建设_佛山网站建设_粤联网络 | 水质传感器_水质监测站_雨量监测站_水文监测站-山东水境传感科技有限公司 | 超声波清洗机-超声波清洗设备定制生产厂家 - 深圳市冠博科技实业有限公司 | MOOG伺服阀维修,ATOS比例流量阀维修,伺服阀维修-上海纽顿液压设备有限公司 | 天津仓储物流-天津电商云仓-天津云仓一件代发-博程云仓官网 | 生产自动包装秤_颗粒包装秤_肥料包装秤等包装机械-郑州鑫晟重工科技有限公司 | 液氨泵,液化气泵-淄博「亚泰」燃气设备制造有限公司 | 节流截止放空阀-不锈钢阀门-气动|电动截止阀-鸿华阀门有限公司 | 防火板_饰面耐火板价格、厂家_品牌认准格林雅 | 鹤壁创新仪器公司-全自动量热仪,定硫仪,煤炭测硫仪,灰熔点测定仪,快速自动测氢仪,工业分析仪,煤质化验仪器 | 编织人生 - 权威手工编织网站,编织爱好者学习毛衣编织的门户网站,织毛衣就上编织人生网-编织人生 | ZHZ8耐压测试仪-上海胜绪电气有限公司 | 红酒招商加盟-葡萄酒加盟-进口红酒代理-青岛枞木酒业有限公司 | 空冷器|空气冷却器|空水冷却器-无锡赛迪森机械有限公司[官网] | 浙江华锤电器有限公司_地磅称重设备_防作弊地磅_浙江地磅售后维修_无人值守扫码过磅系统_浙江源头地磅厂家_浙江工厂直营地磅 | 考勤系统_人事考勤管理系统_本地部署BS考勤系统_考勤软件_天时考勤管理专家 | 美的商用净水器_美的直饮机_一级代理经销商_Midea租赁价格-厂家反渗透滤芯-直饮水批发品牌售后 | 恒温油槽-恒温水槽-低温恒温槽厂家-宁波科麦仪器有限公司 | 北京公积金代办/租房发票/租房备案-北京金鼎源公积金提取服务中心 | 温泉机设备|温泉小镇规划设计|碳酸泉设备 - 大连连邦温泉科技 | 四探针电阻率测试仪-振实密度仪-粉末流动性测定仪-宁波瑞柯微智能 | 数码听觉统合训练系统-儿童感觉-早期言语评估与训练系统-北京鑫泰盛世科技发展有限公司 | 仪器仪表网 - 永久免费的b2b电子商务平台 | 贵阳用友软件,贵州财务软件,贵阳ERP软件_贵州优智信息技术有限公司 | 天津货架厂_穿梭车货架_重型仓储货架_阁楼货架定制-天津钢力仓储货架生产厂家_天津钢力智能仓储装备 | 恒压供水控制柜|无负压|一体化泵站控制柜|PLC远程调试|MCGS触摸屏|自动控制方案-联致自控设备 | 布袋除尘器|除尘器设备|除尘布袋|除尘设备_诺和环保设备 | 江苏全风,高压风机,全风环保风机,全风环形高压风机,防爆高压风机厂家-江苏全风环保科技有限公司(官网) | 巨野电机维修-水泵维修-巨野县飞宇机电维修有限公司 | 武汉森源蓝天环境科技工程有限公司-为环境污染治理提供协同解决方案 |