中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
機器學習實戰:使用R、tidyverse和mlr

包郵 機器學習實戰:使用R、tidyverse和mlr

出版社:清華大學出版社出版時間:2021-06-01
開本: 其他 頁數: 396
中 圖 價:¥70.8(6.0折) 定價  ¥118.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

機器學習實戰:使用R、tidyverse和mlr 版權信息

  • ISBN:9787302578277
  • 條形碼:9787302578277 ; 978-7-302-57827-7
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

機器學習實戰:使用R、tidyverse和mlr 本書特色

為什么使用R語言進行機器學習? R和Python是兩種*常用的數據科學語言,兩種語言并沒有絕對優勢,各有所長。Python是更通用的編程語言,先進的深度學習方法更容易通過使用Python來編寫實現。R語言擅長數據分析、統計建模,有簡化數據科學任務的tidyverse程序包。 為什么要用mlr程序包? R語言中機器學習算法的通用接口,類似于Python的scikit-learn庫。 為什么要用tidyverse程序包? 數據處理是機器學習中*耗時和復雜的部分,tidyverse程序包可以使數據的處理、轉換和可視化變得簡單、合理且可復制,大大簡化了數據整理的過程。

機器學習實戰:使用R、tidyverse和mlr 內容簡介

《機器學習實戰使用R、tidyverse和mlr》將使用RStudio和很好棒的mlr程序包開啟你的機器學習之旅。這本實用指南簡化了理論,避免了不必要的復雜統計和數學知識,所有核心的機器學習技術都通過圖形和易于掌握的示例進行清晰的解釋。每一章的內容都十分引人入勝,你將掌握如何把新的算法付諸實踐,以解決各種預測分析問題,包括泰坦尼克沉船事件中不同乘客的幸存概率、垃圾郵件過濾、毒酒事件調查等。 主要內容 使用tidyverse程序包處理和繪制數據 監督機器學習和非監督機器學習技術 分類、回歸、降維和聚類算法 統計學基礎

機器學習實戰:使用R、tidyverse和mlr 目錄

目 錄



第Ⅰ部分 簡介

第1章 機器學習介紹 2

1.1 機器學習的概念 3

1.2 機器學習算法的分類 7

1.3 關于機器學習道德影響的思考 12

1.4 使用R語言進行機器學習的原因 13

1.5 使用哪些數據集 13

1.6 從本書可以學到什么 13

1.7 本章小結 14

第2章 使用tidyverse整理、操作和繪制數據 15

2.1 tidyverse和整潔數據的概念 15

2.2 加載tidyverse 17

2.3 tibble程序包及其功能介紹 17

2.4 dplyr程序包及其功能介紹 21

2.5 ggplot2程序包及其功能介紹 26

2.6 tidyr程序包及其功能介紹 29

2.7 purrr程序包及其功能介紹 32

2.8 本章小結 38

2.9 練習題答案 38

第Ⅱ部分 分類算法

第3章 基于相似性的k近鄰分類 42

3.1 k近鄰算法的概念 42

3.2 建立**個kNN模型 45

3.3 平衡模型誤差的兩個來源:偏差-方差權衡 51

3.4 運用交叉驗證判斷是否過擬合或欠擬合 52

3.5 交叉驗證kNN模型 53

3.6 算法將要學習的內容以及它們必須知道的內容:參數和超參數 59

3.7 調節k值以改進模型 60

3.8 kNN算法的優缺點 64

3.9 本章小結 64

3.10 練習題答案 65

第4章 對數幾率回歸分類 67

4.1 什么是對數幾率回歸 67

4.2 建立**個對數幾率回歸模型 74

4.3 交叉驗證對數幾率回歸模型 81

4.4 理解模型:幾率比 83

4.5 使用模型進行預測 84

4.6 對數幾率回歸算法的優缺點 84

4.7 本章小結 85

4.8 練習題答案 85

第5章 基于判別分析的*大分離方法 88

5.1 什么是判別分析 88

5.2 構建線性和二次判別模型 95

5.3 LDA和QDA算法的優缺點 100

5.4 本章小結 101

5.5 練習題答案 101

第6章 樸素貝葉斯和支持向量機分類算法 103

6.1 什么是樸素貝葉斯算法 104

6.2 建立**個樸素貝葉斯模型 107

6.3 樸素貝葉斯算法的優缺點 110

6.4 什么是支持向量機(SVM)算法 110

6.5 構建**個SVM模型 117

6.6 交叉驗證SVM模型 123

6.7 SVM算法的優缺點 124

6.8 本章小結 124

6.9 練習題答案 125

第7章 決策樹分類算法 127

7.1 什么是遞歸分區算法 127

7.2 構建**個決策樹模型 133

7.3 加載和研究zoo數據集 134

7.4 訓練決策樹模型 134

7.5 交叉驗證決策樹模型 139

7.6 決策樹算法的優缺點 140

7.7 本章小結 140

第8章 使用隨機森林算法和boosting技術改進決策樹 142

8.1 集成學習技術:bagging、boosting和stacking 142

8.2 建立**個隨機森林模型 148

8.3 建立**個XGBoost模型 150

8.4 隨機森林和XGBoost算法的優缺點 155

8.5 在算法之間進行基準測試 155

8.6 本章小結 156

第Ⅲ部分 回歸算法

第9章 線性回歸 158

9.1 什么是線性回歸 158

9.2 建立**個線性回歸模型 163

9.3 線性回歸的優缺點 178

9.4 本章小結 178

9.5 練習題答案 179

第10章 廣義加性模型的非線性回歸 180

10.1 使用多項式項使線性回歸非線性 180

10.2 更大的靈活性:樣條曲線和廣義加性模型 182

10.3 建立**個GAM 184

10.4 GAM的優缺點 188

10.5 本章小結 188

10.6 練習題答案 189

第11章 利用嶺回歸、LASSO回歸和彈性網絡控制過擬合 190

11.1 正則化的概念 190

11.2 嶺回歸的概念 191

11.3 L2范數的定義及其在嶺回歸中的應用 193

11.4 L1范數的定義及其在LASSO中的應用 195

11.5 彈性網絡的定義 197

11.6 建立嶺回歸、LASSO和彈性網絡模型 198

11.7 對嶺回歸、LASSO、彈性網絡和OLS進行基準測試并對比 210

11.8 嶺回歸、LASSO和彈性網絡的優缺點 211

11.9 本章小結 212

11.10 練習題答案 212

第12章 使用kNN、隨機森林和XGBoost進行回歸 215

12.1 使用kNN算法預測連續變量 215

12.2 使用基于決策樹的算法預測連續變量 217

12.3 建立**個kNN回歸模型 219

12.4 建立**個隨機森林回歸模型 226

12.5 建立**個XGBoost回歸模型 227

12.6 對kNN、隨機森林和XGBoost模型的構建過程進行基準測試 229

12.7 kNN、隨機森林和XGBoost算法的優缺點 230

12.8 本章小結 230

12.9 練習題答案 231

第Ⅳ部分 降維算法

第13章 *大化方差的主成分分析法 234

13.1 降維的目的 234

13.2 主成分分析的概念 236

13.3 構建**個PCA模型 240

13.4 PCA的優缺點 247

13.5 本章小結 247

13.6 練習題答案 247

第14章 *大化t-SNE和UMAP的相似性 249

14.1 t-SNE的含義 249

14.2 建立**個t-SNE模型 253

14.3 UMAP的含義 256

14.4 建立**個UMAP模型 258

14.5 t-SNE和UMAP的優缺點 261

14.6 本章小結 261

14.7 練習題答案 262

第15章 自組織映射和局部線性嵌入 263

15.1 先決條件:節點網格和流形 263

15.2 自組織映射的概念 264

15.3 建立**個SOM 268

15.4 局部線性嵌入的概念 277

15.5 建立**個LLE 278

15.6 建立跳蚤數據集的LLE 282

15.7 SOM和LLE的優缺點 283

15.8 本章小結 284

15.9 練習題答案 284

第Ⅴ部分 聚類算法

第16章 使用k-均值算法尋找中心聚類 288

16.1 k-均值算法的定義 288

16.2 建立**個k-均值算法模型 292

16.3 k-均值算法的優缺點 304

16.4 本章小結 304

16.5 練習題答案 304

第17章 層次聚類 306

17.1 什么是層次聚類 306

17.2 建立**個聚合層次聚類模型 311

17.3 聚類穩定嗎 318

17.4 層次聚類的優缺點 320

17.5 本章小結 320

17.6 練習題答案 320

第18章 基于密度的聚類:DBSCAN和OPTICS 323

18.1 基于密度的聚類的定義 323

18.2 建立DBSCAN模型 331

18.3 建立OPTICS模型 343

18.4 基于密度的聚類的優缺點 345

18.5 本章小結 346

18.6 練習題答案 346

第19章 基于混合建模的分布聚類 348

19.1 混合模型聚類的概念 348

19.2 建立**個用于聚類的高斯混合模型 353

19.3 混合模型聚類的優缺點 356

19.4 本章小結 357

19.5 練習題答案 357

第20章 *終筆記和進一步閱讀 359

20.1 簡要回顧機器學習概念 359

20.2 學完本書后,還可以學習哪些內容 367

20.3 結語 369

附錄 復習統計學概念 370


展開全部

機器學習實戰:使用R、tidyverse和mlr 作者簡介

Hefin I. Rhys是一位有著8年教授R語言、統計學和機器學習經驗的生命科學家和細胞學家。他將自己的統計學/機器學習知識貢獻給多項學術研究,并熱衷于講授統計學、機器學習和數據可視化方面的課程。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 氟氨基酮、氯硝柳胺、2-氟苯甲酸、异香兰素-新晨化工 | 瑞典Blueair空气净化器租赁服务中心-专注新装修办公室除醛去异味服务! | 臭氧老化试验箱,高低温试验箱,恒温恒湿试验箱,防水试验设备-苏州亚诺天下仪器有限公司 | 进口便携式天平,外校_十万分之一分析天平,奥豪斯工业台秤,V2000防水秤-重庆珂偌德科技有限公司(www.crdkj.com) | 危废处理系统,水泥厂DCS集散控制系统,石灰窑设备自动化控制系统-淄博正展工控设备 | 全球化工设备网—化工设备,化工机械,制药设备,环保设备的专业网络市场。 | 罗茨真空机组,立式无油往复真空泵,2BV水环真空泵-力侨真空科技 | 探鸣起名网-品牌起名-英文商标起名-公司命名-企业取名包满意 | 品牌策划-品牌设计-济南之式传媒广告有限公司官网-提供品牌整合丨影视创意丨公关活动丨数字营销丨自媒体运营丨数字营销 | 生物制药洁净车间-GMP车间净化工程-食品净化厂房-杭州波涛净化设备工程有限公司 | PE拉伸缠绕膜,拉伸缠绕膜厂家,纳米缠绕膜-山东凯祥包装 | 西点培训学校_法式西点培训班_西点师培训_西点蛋糕培训-广州烘趣西点烘焙培训学院 | 涡轮流量计_LWGY智能气体液体电池供电计量表-金湖凯铭仪表有限公司 | 油液红外光谱仪-油液监测系统-燃油嗅探仪-上海冉超光电科技有限公司 | 磨煤机配件-高铬辊套-高铬衬板-立磨辊套-盐山县宏润电力设备有限公司 | 全自动过滤器_反冲洗过滤器_自清洗过滤器_量子除垢环_量子环除垢_量子除垢 - 安士睿(北京)过滤设备有限公司 | 大型多片锯,圆木多片锯,方木多片锯,板材多片锯-祥富机械有限公司 | 老房子翻新装修,旧房墙面翻新,房屋防水补漏,厨房卫生间改造,室内装潢装修公司 - 一修房屋快修官网 | 考勤系统_考勤管理系统_网络考勤软件_政企|集团|工厂复杂考勤工时统计排班管理系统_天时考勤 | 中细软知识产权_专业知识产权解决方案提供商 | 杭州ROHS检测仪-XRF测试仪价格-百科 | 上海软件开发-上海软件公司-软件外包-企业软件定制开发公司-咏熠科技 | 台湾Apex减速机_APEX行星减速机_台湾精锐减速机厂家代理【现货】-杭州摩森机电 | 精密五金冲压件_深圳五金冲压厂_钣金加工厂_五金模具加工-诚瑞丰科技股份有限公司 | LED显示屏_LED屏方案设计精准报价专业安装丨四川诺显科技 | 传动滚筒_厂家-淄博海恒机械制造厂 | 执业药师报名时间,报考条件,考试时间-首页入口 | 吲哚菁绿衍生物-酶底物法大肠菌群检测试剂-北京和信同通科技发展有限公司 | 电池挤压试验机-自行车喷淋-车辆碾压试验装置-深圳德迈盛测控设备有限公司 | 抖音短视频运营_企业网站建设_网络推广_全网自媒体营销-东莞市凌天信息科技有限公司 | 安徽合肥格力空调专卖店_格力中央空调_格力空调总经销公司代理-皖格制冷设备 | 英超直播_英超免费在线高清直播_英超视频在线观看无插件-24直播网 | 翅片管散热器价格_钢制暖气片报价_钢制板式散热器厂家「河北冀春暖气片有限公司」 | 517瓜水果特产网|一个专注特产好物的网站 | 山东活动策划|济南活动公司|济南公关活动策划-济南锐嘉广告有限公司 | 激光内雕_led玻璃_发光玻璃_内雕玻璃_导光玻璃-石家庄明晨三维科技有限公司 激光内雕-内雕玻璃-发光玻璃 | 粉末包装机,拆包机厂家,价格-上海强牛包装机械设备有限公司 | 【同风运车官网】一站式汽车托运服务平台,验车满意再付款 | 金环宇|金环宇电线|金环宇电缆|金环宇电线电缆|深圳市金环宇电线电缆有限公司|金环宇电缆集团 | 杭州用友|用友软件|用友财务软件|用友ERP系统--杭州协友软件官网 | 臻知网大型互动问答社区-你的问题将在这里得到解答!-无锡据风网络科技有限公司 |