中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
Linux經典實例(第二版)

包郵 Linux經典實例(第二版)

出版社:中國電力出版社出版時間:2023-03-01
開本: 16開 頁數: 580
中 圖 價:¥94.1(5.6折) 定價  ¥168.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

Linux經典實例(第二版) 版權信息

Linux經典實例(第二版) 本書特色

Linux學習的必讀經典書籍,Linux用戶及系統與網絡管理員的實用技巧。 編輯推薦這本實用手冊向初中級Linux用戶介紹了通過圖形及命令行工具管理Linux系統的重要技巧。無論你的Linux系統是嵌入式、桌面版、服務器、云服務,還是虛擬環境,其基礎知識都是相同的。本書介紹了大量示例,可幫助你快速入門并運行Linux。 本書針對各種具體問題,提出解決方案,并詳細解釋了涉及到的技術原理,*后還給出了參考資料以供深入學習。 專家推薦“Linux學習的必讀經典書籍。作者深入簡出地介紹了Linux操作系統的各個方面。”—— Jack Wallen,屢獲殊榮的科技作家,TechRepublic、The New Stack等網站撰稿人“高效工程師不僅了解工具,還知道如何高效地使用工具。本書介紹的Linux工具讓人嘆為觀止。”—— Jonathan Johnson,Dijure獨立軟件顧問與培訓師 實戰導向:以企業應用為主線的知識脈絡,以實際工作為導向,做到學習的有的放矢,變被動學習為主動求知 圖文解析:輕松講解晦澀理論,將復雜的問題簡單化,把抽象的問題具體化 系統全面:涵蓋了作為合格的Linux運維工程師必學必會的知識點和實驗項目,幫助廣大讀者跨過技術的**道門檻,快速融入Linux的世界

Linux經典實例(第二版) 內容簡介

本書針對各種具體問題,提出解決方案,并詳細解釋了涉及到的技術原理,*z后還給出了參考資料以供深入學習。本書的主要內容有:學習使用全新的通用服務管理器systemd。利用firewalld構建簡單或復雜的防火墻。保證Linux系統與移動設備間網絡連接的安全。搶救無法引導的系統。重置Linux與Windows的用戶密碼。利用dnsmasq管理局域網名稱服務。管理用戶與組,控制文件的訪問。探測計算機硬件,監控硬件健康。管理GRUB引導加載程序,設置Linux與Windows雙啟動。通過*z新的工具同步網絡上所有系統的時間。在樹莓派上構建互聯網路由器與防火墻。管理文件系統與分區。

Linux經典實例(第二版) 目錄

目錄

前言 .1

第1 章 強化學習概述 .13

1.1 為什么現在就需要強化學習? . 14

1.2 機器學習 15

1.3 強化學習 17

1.3.1 什么時候使用強化學習 19

1.3.2 強化學習的應用場景 20

1.4 強化學習的種類 22

1.4.1 免模型學習或有模型學習 . 22

1.4.2 智能體如何使用并更新它們的策略 23

1.4.3 離散或連續的行為 . 25

1.4.4 優化方法. 25

1.4.5 策略評估和改進 . 26

1.5 強化學習的基本概念 . 27

1.5.1 歷史上**個強化學習算法 . 28

1.5.2 強化學習和機器學習是一種東西嗎? . 31

1.5.3 獎勵和反饋 32

1.6 強化學習的發展簡史 . 35

1.7 本章總結 37

1.8 擴展閱讀 38

1.9 參考文獻 38

第2 章 馬爾可夫決策過程,動態規劃,蒙特卡洛方法 44

2.1 多臂老虎機測試 44

2.1.1 獎勵工程. 45

2.1.2 策略評估:價值函數 45

2.1.3 策略改進:選擇*佳動作 48

2.1.4 模擬環境. 50

2.1.5 運行實驗. 50

2.1.6 ε - 貪婪算法的改進. 52

2.2 馬爾可夫決策過程 . 54

2.2.1 庫存控制. 56

2.2.2 庫存控制仿真 . 60

2.3 策略與價值函數 62

2.3.1 打折的獎勵 62

2.3.2 用狀態– 價值函數預測獎勵 64

2.3.3 用動作值函數預測獎勵 . 67

2.3.4 *優策略. 69

2.4 蒙特卡洛策略生成 70

2.5 動態規劃的值迭代 72

2.5.1 值迭代的過程 74

2.5.2 數值迭代結果 76

2.6 總結 78

2.7 擴展閱讀 79

2.8 參考文獻 79

第3 章 時序差分學習,Q 學習和n 步算法 80

3.1 時序差分學習的相關公式 81

3.1.1 Q 學習 . 83

3.1.2 SARSA 85

3.1.3 Q 學習與SARSA 方法的對比 . 87

3.1.4 案例解析:自動擴展應用程序容器以降低成本 . 90

3.2 行業實例:廣告中的實時競價 . 92

3.2.1 MDP 的定義 . 92

3.2.2 實時競價案例的環境 93

3.2.3 進一步改進 94

3.3 Q 學習的相關擴展 96

3.3.1 雙重Q 學習 96

3.3.2 延遲Q 學習 97

3.3.3 各類版本的Q 學習之間的對比 98

3.3.4 對抗學習. 98

3.4 n 步算法 99

3.5 有效跟蹤 104

3.6 有效跟蹤算法的擴展 107

3.6.1 沃特金斯的Q(λ) 107

3.6.2 沃特金斯Q(λ) 的模糊擦除 . 108

3.6.3 快速Q 學習 108

3.6.4 積累式有效跟蹤與取代式有效跟蹤 108

3.7 總結 . 109

3.8 擴展閱讀 110

3.9 參考文獻 110

第4 章 深度Q 網絡 . 112

4.1 深度學習的體系結構 113

4.1.1 基礎知識 113

4.1.2 深度學習架構 114

4.1.3 深度學習庫 . 115

4.1.4 深度強化學習 117

4.2 深度Q 學習 . 117

4.2.1 經驗重放 118

4.2.2 克隆Q 網絡 118

4.2.3 神經網絡結構 119

4.2.4 DQN 的實現 119

4.2.5 實際案例:倒立擺環境中的DQN 120

4.2.6 案例研究:減少建筑物的能源使用 125

4.3 彩虹DQN 126

4.3.1 分配強化學習 126

4.3.2 優先經驗重放 129

4.3.3 噪聲網絡 129

4.3.4 決斗網絡 129

4.4 實際案例:雅達利的彩虹DQN 130

4.4.1 結果 131

4.4.2 討論 132

4.5 其他DQN 改進 134

4.5.1 改進探索過程 135

4.5.2 改進獎勵過程 136

4.5.3 從離線數據中進行學習 137

4.6 總結 . 139

4.7 擴展閱讀 140

4.8 參考文獻 140

第5 章 梯度策略 144

5.1 直接學習策略的優勢 144

5.2 如何計算策略的梯度 145

5.3 策略梯度理論 . 146

5.4 策略函數 149

5.4 1 線性策略 149

5.4.2 其他策略 151

5.5 基本實現 152

5.5.1 蒙特卡洛算法(強化算法) 152

5.5.2 帶基線的強化算法 153

5.5.3 梯度方差的減小 157

5.5.4 n 步演員評論家和優勢演員評論家(A2C) . 159

5.5.5 基于資格跡的演員評論家算法 . 164

5.5.6 基本策略梯度算法的比較 165

5.6 行業研究:為客戶自動提供產品 . 166

5.6.1 行業實例:Gym 環境中的購物車實驗 . 167

5.6.2 預設期望 168

5.6.3 購物車實驗環境的結果展示 169

5.7 總結 . 173

5.8 擴展閱讀 174

5.9 參考文獻 174

第6 章 超越策略梯度 176

6.1 離線算法 177

6.1.1 重要性抽樣 177

6.1.2 行為和目標策略 179

6.1.3 離線 Q 學習 180

6.1.4 梯度時差學習 180

6.1.5 Greedy-GQ 算法 181

6.1.6 離線演員評論家算法 . 182

6.2 決定性策略梯度 183

6.2.1 決定性策略梯度 183

6.2.2 深度確定性策略梯度 . 185

6.2.3 雙延遲DDPG 189

6.2.4 案例研究:利用到用戶評論的推薦算法 193

6.2.5 改進DPG. 194

6.3 信賴域方法 195

6.3.1 Kullback-Leibler 散度 197

6.3.2 自然策略梯度與信任區域策略優化 198

6.3.3 近端策略優化 201

6.4 實際案例:在現實生活中使用伺服器 206

6.4.1 實驗設置 . 206

6.4.2 強化學習算法實現 207

6.4.3 增加算法的復雜度 210

6.4.4 模擬中的超參數調優 . 211

6.4.5 產生的策略 212

6.5 其他策略梯度算法 214

6.5.1 回溯(λ) 214

6.5.2 有經驗重放的演員評論家(ACER) 214

6.5.3 使用Kronecker 因子信任區域的演員評論家算法(ACKTR) 215

6.5.4 更多相關方法 216

6.6 策略梯度算法的擴展 216

6.7 總結 . 217

6.7.1 應該使用哪種算法? . 217

6.7.2 關于異步方法的注意事項 218

6.8 擴展閱讀 218

6.9 參考文獻 219

第7 章 用熵方法學習所有可能的策略 225

7.1 什么是熵? 225

7.2 *大熵強化學習 226

7.3 弱演員評論家算法 227

7.3.1 SAC 的實現細節與離散動作空間 228

7.3.2 自動調整溫度 229

7.3.3 案例研究:有助于減少交通擁堵的自動化交通管理系統 229

7.4 *大熵方法的推廣 231

7.4.1 熵的其他度量(以及策略集) . 231

7.4.2 基于雙重Q 學習上限的優化探索 231

7.4.3 通過歷史經驗重放改進結果 232

7.4.4 軟策略梯度 . 232

7.4.5 軟Q 學習(及其擴展) 232

7.4.6 路徑一致性學習 233

7.5 性能比較:SAC 與PPO 233

7.6 熵是如何激勵智能體進行探索的? . 235

7.7 行業實例:通過遙控車學習自動駕駛 240

7.7.1 問題描述 241

7.7.2 減少訓練時間 241

7.7.3 夸張的動作 . 244

7.7.4 超參數探索 . 246

7.7.5 *終策略 246

7.7.6 進一步改進 . 247

7.8 本章總結 248

7.8.1 策略梯度與軟Q 學習的等價性 249

7.8.2 這對今后的發展意味著什么? . 249

7.8.3 這對目前來說意味著什么? 249

7.9 參考文獻 250

第8 章 改進智能體的學習方式 253

8.1 關于MDP 的思考 . 254

8.1.1 部分可觀察馬爾可夫決策過程 . 254

8.1.2 案例研究:POMDP 在自動駕駛汽車中的應用 256

8.1.3 上下文馬爾可夫決策過程 . 257

8.1.4 動作不斷變化的MDPs 257

8.1.5 正則化MDP 258

8.2 層次強化學習 . 259

8.2.1 初級層次強化學習 . 259

8.2.2 具有內在獎勵的層次強化學習(HIRO) 260

8.2.3 學習技巧和無監督學習 262

8.2.4 在HRL 中使用技能 263

8.2.5 HRL 研究結論 264

8.3 多智能體強化學習 265

8.3.1 MARL 的框架 265

8.3.2 集中式或分布式 267

8.3.3 單智能體算法 268

8.3.4 案例研究:單智能體分散學習在無人機中的應用 . 269

8.3.5 集中學習,分散執行 . 270

8.3.6 分散的學習 . 272

8.3.7 其他的組合 . 273

8.3.8 MARL 的挑戰 274

8.3.9 MARL 的結論 275

8.4 專家的指導 276

8.4.1 克隆行為 276

8.4.2 模擬強化學習 276

8.4.3 反向強化學習 277

8.4.4 課程學習 279

8.5 其他案例 281

8.5.1 元學習 281

8.5.2 遷移學習 281

8.6 總結 . 282

8.7 擴展閱讀 283

8.8 參考文獻 285

第9 章 強化學習實踐 293

9.1 強化學習的生命周期 293

9.2 問題定義:一個真正的強化學習項目到底包括什么? . 299

9.2.1 強化學習問題是連續性問題 299

9.2.2 強化學習問題是戰略性問題 300

9.2.3 強化學習中的基礎指標 302

9.2.4 學習類型 304

9.3 強化學習工程和改進 309

9.3.1 項目過程 309

9.3.2 環境工程 310

9.3.3 狀態工程或狀態表示學習 313

9.3.4 策略工程 316

9.3.5 將策略映射到操作空間 322

9.3.6 探索 326

9.3.7 獎勵工程 333

9.4 總結 . 337

9.5 擴展閱讀 338

9.6 參考文獻 339

第10 章 強化學習的生產部署 348

10.1 實現階段 . 349

10.1.1 框架 . 349

10.1.2 大規模強化學習 353

10.1.3 評價 . 361

10.2 部署 370

10.2.1 目標 . 371

10.2.2 體系架構 374

10.2.3 輔助工具 376

10.2.4 安全、保障和道德 382

10.3 總結 389

10.4 擴展閱讀 . 390

10.5 參考文獻 . 392

第11 章 結論與展望 . 400

11.1 提示和技巧 400

11.1.1 框架問題 400

11.1.2 你的數據 402

11.1.3 訓練 . 403

11.1.4 評價 . 404

11.1.5 部署 . 404

11.2 調試 405

11.2.1 ${ALGORITHM_NAME} 不能解決${ENVIRONMENT}! 406

11.2.2 監測調試 407

11.3 強化學習的未來 408

11.3.1 強化學習市場機會 409

11.3.2 強化學習的研究方向 410

11.4 結束語 416

11.4.1 未來下一步 417

11.4.2 現在輪到你了! . 418

11.5 擴展閱讀 . 418

11.6 參考文獻 . 419

附錄A 兩種動作的Logistic 策略梯度 423

附錄B Softmax 的策略梯度 . 427


展開全部

Linux經典實例(第二版) 作者簡介

Carla Schroder是一名科技記者與作家,擁有系統與網絡管理員的經驗,曾負責管理Linux-微軟-蘋果混合網絡。她撰寫過1000多篇Linux操作指南,目前就職于一家Linux企業軟件公司,負責編寫和維護產品手冊。出版的書籍有《Linux Networking Cookbook》《The Book of Audacity》等。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 贴片电容-贴片电阻-二三极管-国巨|三星|风华贴片电容代理商-深圳伟哲电子 | 山东商品混凝土搅拌楼-环保型搅拌站-拌合站-分体仓-搅拌机厂家-天宇 | 防爆暖风机_防爆电暖器_防爆电暖风机_防爆电热油汀_南阳市中通智能科技集团有限公司 | 100_150_200_250_300_350_400公斤压力空气压缩机-舰艇航天配套厂家 | 无菌实验室规划装修设计-一体化实验室承包-北京洁净净化工程建设施工-北京航天科恩实验室装备工程技术有限公司 | 熔体泵|换网器|熔体齿轮泵|熔体计量泵厂家-郑州巴特熔体泵有限公司 | EDLC超级法拉电容器_LIC锂离子超级电容_超级电容模组_软包单体电容电池_轴向薄膜电力电容器_深圳佳名兴电容有限公司_JMX专注中高端品牌电容生产厂家 | 圆盘鞋底注塑机_连帮鞋底成型注塑机-温州天钢机械有限公司 | 蚂蚁分类信息系统 - PHP同城分类信息系统 - MayiCMS | 旗杆生产厂家_不锈钢锥形旗杆价格_铝合金电动旗杆-上海锥升金属科技有限公司 | 杭州双螺杆挤出机-百科| 环讯传媒,永康网络公司,永康网站建设,永康小程序开发制作,永康网站制作,武义网页设计,金华地区网站SEO优化推广 - 永康市环讯电子商务有限公司 | 航空铝型材,7系铝型材挤压,硬质阳*氧化-余润铝制品 | 诺冠气动元件,诺冠电磁阀,海隆防爆阀,norgren气缸-山东锦隆自动化科技有限公司 | 蜘蛛车-高空作业平台-升降机-高空作业车租赁-臂式伸缩臂叉装车-登高车出租厂家 - 普雷斯特机械设备(北京)有限公司 | 小型手持气象站-空气负氧离子监测站-多要素微气象传感器-山东天合环境科技有限公司 | 不锈钢拉手厂家|浴室门拉手厂家|江门市蓬江区金志翔五金制品有限公司 | 证券新闻,热播美式保罗1984第二部_腾讯1080p-仁爱影院 | 四探针电阻率测试仪-振实密度仪-粉末流动性测定仪-宁波瑞柯微智能 | 越南专线物流_东莞国际物流_东南亚专线物流_行通物流 | 购买舔盐、舔砖、矿物质盐压块机,鱼饵、鱼饲料压块机--请到杜甫机械 | 小型手持气象站-空气负氧离子监测站-多要素微气象传感器-山东天合环境科技有限公司 | 爱佩恒温恒湿测试箱|高低温实验箱|高低温冲击试验箱|冷热冲击试验箱-您身边的模拟环境试验设备技术专家-合作热线:400-6727-800-广东爱佩试验设备有限公司 | 深圳激光打标机_激光打标机_激光焊接机_激光切割机_同体激光打标机-深圳市创想激光科技有限公司 深圳快餐店设计-餐饮设计公司-餐饮空间品牌全案设计-深圳市勤蜂装饰工程 | 氮化镓芯片-碳化硅二极管 - 华燊泰半导体| 上海乾拓贸易有限公司-日本SMC电磁阀_德国FESTO电磁阀_德国FESTO气缸 | 大鼠骨髓内皮祖细胞-小鼠神经元-无锡欣润生物科技有限公司 | 商秀—企业短视频代运营_抖音企业号托管 | 执业药师报名时间,报考条件,考试时间-首页入口 | 福州时代广告制作装饰有限公司-福州广告公司广告牌制作,福州展厅文化墙广告设计, | 讲师宝经纪-专业培训机构师资供应商_培训机构找讲师、培训师、讲师经纪就上讲师宝经纪 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 合肥办公室装修 - 合肥工装公司 - 天思装饰 | 塑料撕碎机_编织袋撕碎机_废纸撕碎机_生活垃圾撕碎机_废铁破碎机_河南鑫世昌机械制造有限公司 | 红酒招商加盟-葡萄酒加盟-进口红酒代理-青岛枞木酒业有限公司 | 卓能JOINTLEAN端子连接器厂家-专业提供PCB接线端子|轨道式端子|重载连接器|欧式连接器等电气连接产品和服务 | 科普仪器菏泽市教育教学仪器总厂 | 艾默生变频器,艾默生ct,变频器,ct驱动器,广州艾默生变频器,供水专用变频器,风机变频器,电梯变频器,艾默生变频器代理-广州市盟雄贸易有限公司官方网站-艾默生变频器应用解决方案服务商 | 赛尔特智能移动阳光房-阳光房厂家-赛尔特建筑科技(广东)有限公司 | RS系列电阻器,RK_RJ启动调整电阻器,RQ_RZ电阻器-上海永上电器有限公司 | 制氮设备_PSA制氮机_激光切割制氮机_氮气机生产厂家-苏州西斯气体设备有限公司 |