中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊

包郵 R數據挖掘實戰

出版社:人民郵電出版社出版時間:2024-05-01
開本: 16開 頁數: 310
中 圖 價:¥69.9(7.0折) 定價  ¥99.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

R數據挖掘實戰 版權信息

R數據挖掘實戰 本書特色

通過本書的學習,讀者能夠:

·掌握數據挖掘的相關軟件包,如dplyr、ggplot2等。

·學會如何通過數據挖掘標準流程(CRISP-DM)來有效地組織數據挖掘項目。

·對數據執行數據清理和數據驗證操作—為數據挖掘活動準備數據。

·以數值方式和圖形方式分別執行探索性數據分析。

·開發簡單線性回歸模型、多元線性回歸模型以及邏輯回歸模型。

·應用基本的集成學習技術整合不同數據挖掘模型的結果。

·對非結構化的PDF文件和文本數據執行文本挖掘及分析。

·編制有效傳達數據分析目標、方法和洞察的報告。

R數據挖掘實戰 內容簡介

本書通過循序漸進的介紹,讓讀者借助基礎以及優選的數據挖掘技術,幫助一個虛擬的商業公司解決對其造成負面影響的真實欺詐案例。通過全程參與這一極不尋常的數據挖掘案例,讀者將會掌握數據挖掘方面的強大技能。 本書非常適合想通過R語言快速了解數據挖掘、預測分析、商業分析等領域的數據科學家和數據分析員閱讀,也適合高等院校數據挖掘相關專業師生和對數據挖掘感興趣的技術人員參考。

R數據挖掘實戰 目錄

第 1 章 為何選擇 R 語言 1

1.1 什么是 R 語言 1

1.2 R 語言的發展歷史 2

1.3 R 語言的優勢 2

1.3.1 開源 3

1.3.2 插件就緒 3

1.3.3 數據可視化友好 4

1.4 安裝 R 語言、編寫 R 語言

代碼 5

1.4.1 下載 R 語言軟件包 5

1.4.2 應用于 Windows 平臺和

MacOS 平臺的 R 語言

軟件包 5

1.4.3 應用于 Linux 平臺的

R 語言軟件包 6

1.4.4 基礎版本 R 語言包安裝的

主要組件 6

1.4.5 編寫 R 語言及運行 R 語言

代碼的替代平臺 8

1.5 R 語言的基本概念 11

1.5.1 R 語言初級入門 11

1.5.2 向量(Vector) 14

1.5.3 列表(Lists) 15

1.5.4 數據幀(Data frames) 17

1.5.5 函數(Functions) 18

1.6 R 語言的劣勢以及如何克服

這些劣勢 20

1.6.1 高效學習 R 語言,

*小化精力投入 21

1.6.2 通過 R 語言操作大型

數據集 24

1.7 更多參考 25

1.8 小結 25

第 2 章 數據挖掘入門-讀者銀行賬戶

數據分析 26

2.1 獲取并準備銀行數據 26

2.1.1 數據模型 27

2.2 使用數據透視表匯總數據 27

2.2.1 管道操作符簡介 29

2.2.2 dplyr 程序包簡介 30

2.2.3 安裝必要程序包并將

個人數據加載到 R 語言

環境中 31

2.2.4 確定每月和每天的

費用總額 32

2.4 使用 ggplot2 程序包對數據進行

可視化處理 36

2.4.1 數據可視化基本

原理 36

2.4.2 使用 ggplot 程序包來進行

數據可視化 42

2.5 更多參考 47

2.6 小結 47

第 3 章 數據挖掘進階-數據挖掘標準

流程(CRISP-DM)方法論 49

3.1 數據挖掘標準流程(CRISP-DM)

方法論之數據挖掘周期 50

3.2 業務理解 51

3.3 數據理解 51

3.3.1 數據收集 52

3.3.2 數據描述 52

3.3.3 數據探索 53

3.4 數據準備 57

3.5 建模 57

3.5.1 定義數據建模策略 58

3.6 評估 59

3.6.1 聚類評估 59

3.6.2 分類評估 60

3.6.3 回歸評估 60

3.6.4 如何判斷模型性能的

充分性 61

3.7 部署 62

3.7.1 部署計劃開發 62

3.7.2 維護計劃開發 63

3.8 小結 64

第4 章 保持室內整潔-數據挖掘架構 65

4.1 概述 65

4.2 數據源 67

4.2.1 數據源類型 68

4.3 數據庫和數據倉庫 69

4.3.1 中間層-數據集市 70

4.3.2 單層架構的數據倉庫 70

4.3.3 雙層架構的數據倉庫 71

4.3.4 三層架構的數據

倉庫 71

4.3.5 實際應用的技術 72

4.4 數據挖掘引擎 73

4.4.1 解釋器 74

4.4.2 引擎和數據倉庫之間的

接口 74

4.4.3 數據挖掘算法 74

4.5 用戶界面 75

4.5.1 清晰性原則 76

4.6 如何使用 R 語言來創建數據

挖掘架構 79

4.6.1 數據源 79

4.6.2 數據倉庫 80

4.6.3 數據挖掘引擎 80

4.6.4 用戶界面 81

4.7 更多參考 82

4.8 小結 82

第 5 章 如何解決數據挖掘問題-數據

清洗和驗證 83

5.1 安靜祥和的一天 83

5.2 數據清洗 85

5.2.1 Tidy data 框架 85

5.2.2 分析數據的結構 87

5.2.3 數據整理 93

5.2.4 驗證數據 99

5.2.5 數據合并 109

5.3 更多參考 111

5.4 小結 111

第 6 章 觀察數據 - 探索性數據

分析 113

6.1 匯總 EDA 介紹 113

6.1.1 描述總體分布 114

6.1.2 測定變量之間的

相關性 124

6.2 圖形化 EDA 130

6.2.1 變量分布可視化 131

6.2.2 變量關系可視化 136

6.2.3 更多參考 141

6.3 小結 141

第 7 章 *初的猜想-線性回歸 142

7.1 定義數據建模策略 143

7.1.1 數據建模相關概念 146

7.2 應用線性回歸 148

7.2.1 線性回歸的直觀解釋 149

7.2.2 線性回歸的數學

原理 150

7.2.3 如何在 R 語言中使用

線性回歸 152

7.3 更多參考 161

7.4 小結 161

第 8 章 淺談模型性能評估 163

8.1 定義模型性能 163

8.1.1 模型的擬合度與模型的

可解釋性 164

8.1.2 使用模型進行預測 165

8.2 測量回歸模型的性能 167

8.2.1 均方誤差 167

8.2.2 R 平方 172

8.3 衡量分類問題模型的性能 177

8.3.1 混淆矩陣 178

8.3.2 準確度 180

8.3.3 靈敏度 182

8.3.4 特異性 182

8.3.5 如何選擇合適的性能

統計指標 183

8.4 區分訓練數據集與測試

數據集 184

8.5 更多參考 185

8.6 小結 185

第 9 章 不要放棄-繼續學習包括多元

變量的回歸 187

9.1 從簡單線性回歸到多元線性

回歸 188

9.1.1 符號 188

9.1.2 假設 188

9.2 降維 191

9.2.1 逐步回歸 192

9.2.2 主成分回歸 196

9.3 使用 R 語言擬合多元線性

模型 197

9.3.1 模型擬合 197

9.3.2 變量的假設驗證 200

9.3.3 殘差假設驗證 201

9.3.4 降維 202

9.4 更多參考 208

9.5 小結 208

第 10 章 關于分類模型問題的

不同展望 209

10.1 分類模型是什么?讀者為什么

需要分類模型 209

10.1.1 線性回歸應用于分類

變量的局限性 210

10.1.2 常用的分類算法和

模型 211

10.2 邏輯回歸 213

10.2.1 邏輯回歸的原理 213

10.2.2 邏輯回歸的數學

原理 215

10.2.3 如何在 R 中應用邏輯

回歸 218

10.2.4 邏輯回歸結果的

可視化與解釋 224

10.3 支持向量機(SVM) 228

10.3.1 支持向量機的

原支理 229

10.3.2 在原 R 語言中應用支持

向量機 234

10.3.3 理解支持向量機的

結果 235

10.4 更多參考 238

10.5 小結 238

第 11 章 *后沖刺-隨機森林和

集成學習 239

11.1 隨機森林 239

11.1.1 隨機森林的構建模塊-決策樹

簡介 240

11.1.2 隨機森林的原理 243

11.1.3 在 R 語言中應用隨機

森林 243

11.1.4 評估模型的結果 244

11.2 集成學習 249

11.2.1 基礎的集成學習技術 250

11.2.2 采用 R 語言對數據進行

集成學習 250

11.3 在新數據上應用估計模型 256

11.3.1 將 predict.glm()函數用于

邏輯模型的預測 257

11.3.2 將 predict.randomforest()

用于隨機森林的預測 258

11.3.3 將 predict.svm()函數應用

于支持向量機的預測 258

11.4 結構化更加良好的預測分析

方法 258

11.5 對預測數據應用集成學習中的

多數投票技術 259

11.6 更多參考 260

11.7 小結 260

第 12 章 尋找罪魁禍首-用 R 語言執行

文本數據挖掘 262

12.1 提取 PDF 文件中的數據 262

12.1.1 獲取文檔列表 263

12.1.2 通過 pdf_text()函數將

PDF 文件讀取到 R 語言

環境 264

12.1.3 使用 for 循環迭代提取

文本 266

12.2 文本情感分析 269

12.3 開發詞云 272

12.4 N 元組模型(n-grams)

分析 274

12.5 網絡分析 275

12.5.1 從數據幀中獲取邊

列表 279

12.5.2 使用 ggraph 程序包可視化

網絡 279

12.6 更多參考 283

12.7 小結 283

第 13 章 借助 R Markdown 與股東分享

公司現狀 284

13.1 富有說服力的數據挖掘報告之

原則 284

13.1.1 清晰闡明目標 284

13.1.2 明確陳述假設 285

13.1.3 數據處理過程清晰

明了 285

13.1.4 數據一致性 286

13.1.5 提供數據譜系 286

13.2 編制 R MarkDown 報告 287

13.3 在 RStudio 中編制 R Markdown

報告文檔 288

13.3.1 Markdown 簡介 288

13.3.2 插入代碼塊 289

13.3.3 通過內聯 R 語言代碼,

在文本中重現代碼的

輸出 292

13.3.4 Shiny 簡介以及 reactivity

框架 293

13.3.5 添加交互式數據族譜

模塊 297

13.4 渲染和分享 R Markdown

報告 301

13.4.1 渲染 R Markdown

報告 301

13.4.2 分享 R Markdown

報告 301

13.5 更多參考 304

13.6 小結 304

第 14 章 結語 306

附錄 A 處理日期、相對路徑和函數 309

A.1 使用 R 語言處理日期 309

A.2 R 語言中的工作目錄和相對

路徑 309

A.3 條件聲明 310
展開全部

R數據挖掘實戰 作者簡介

[意]安德烈亞·奇里洛(Andrea Cirillo):目前就職于意大利聯合圣保羅銀行(Intesa Sanpaolo Banking Group),擔任審計量化分析師一職。在此之前,他曾在德勤會計師事務所(Deloitte Touche Tohmatsu)從事財務和外部審計相關工作,以及在 FNM(一家意大利上市公司)從事內部審計相關工作。他目前的主要工作職責涉及信用風險管理模型的評估及改進—主要圍繞巴塞爾協議Ⅲ這一領域。他與弗朗西絲卡(Francesca)結婚,并共同養育四個子女,他們的名字名別是:托馬索(Tommaso)、吉安娜(Gianna)、扎卡里亞(Zaccaria)和菲利波(Filippo)。安德里亞(Andrea)曾編寫并供稿一些有用的 R語言軟件包,包括 updateR、ramazon 和 paletteR,此外,他會定期地分享一些關于 R 語言編程的深刻見解和教程。他的研究工作主要聚焦于通過建模定制算法以及開發交互式應用程序,實現 R 語言在風險管理和欺詐檢測領域中的應用。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 螺旋丝杆升降机-SWL蜗轮-滚珠丝杆升降机厂家-山东明泰传动机械有限公司 | 稳尚教育加盟-打造高考志愿填报平台_新高考志愿填报加盟_学业生涯规划加盟 | 连栋温室大棚建造厂家-智能玻璃温室-薄膜温室_青州市亿诚农业科技 | 汽车整车综合环境舱_军标砂尘_盐雾试验室试验箱-无锡苏南试验设备有限公司 | 房屋质量检测-厂房抗震鉴定-玻璃幕墙检测-房屋安全鉴定机构 | 涡轮流量计_LWGY智能气体液体电池供电计量表-金湖凯铭仪表有限公司 | 踏板力计,制动仪,非接触多功能速度仪,逆反射系数测试仪-创宇 | 蓝莓施肥机,智能施肥机,自动施肥机,水肥一体化项目,水肥一体机厂家,小型施肥机,圣大节水,滴灌施工方案,山东圣大节水科技有限公司官网17864474793 | 飞歌臭氧发生器厂家_水处理臭氧发生器_十大臭氧消毒机品牌 | 压力喷雾干燥机,喷雾干燥设备,柱塞隔膜泵-无锡市闻华干燥设备有限公司 | 电磁铁_推拉电磁铁_机械手电磁吸盘电磁铁厂家-广州思德隆电子公司 | 安徽千住锡膏_安徽阿尔法锡膏锡条_安徽唯特偶锡膏_卡夫特胶水-芜湖荣亮电子科技有限公司 | 章丘丰源机械有限公司 - 三叶罗茨风机,罗茨鼓风机,罗茨风机 | 发电机组|柴油发电机组-批发,上柴,玉柴,潍柴,康明斯柴油发电机厂家直销 | 成都顶呱呱信息技术有限公司-贷款_个人贷款_银行贷款在线申请 - 成都贷款公司 | 广东护栏厂家-广州护栏网厂家-广东省安麦斯交通设施有限公司 | 全自动过滤器_反冲洗过滤器_自清洗过滤器_量子除垢环_量子环除垢_量子除垢 - 安士睿(北京)过滤设备有限公司 | 卸料器-卸灰阀-卸料阀-瑞安市天蓝环保设备有限公司 | 高压微雾加湿器_工业加湿器_温室喷雾-昌润空气净化设备 | 山东石英砂过滤器,除氟过滤器「价格低」-淄博胜达水处理 | 浙江工业冷却塔-菱电冷却塔厂家 - 浙江菱电冷却设备有限公司 | 深圳网站建设-高端企业网站开发-定制网页设计制作公司 | 智慧物联网行业一站式解决方案提供商-北京东成基业 | 气密性检测仪_气密性检测设备_防水测试仪_密封测试仪-岳信仪器 | 直线模组_滚珠丝杆滑台_模组滑台厂家_万里疆科技 | 轴流风机-鼓风机-离心风机-散热风扇-罩极电机,生产厂家-首肯电子 | 活性氧化铝球|氧化铝干燥剂|分子筛干燥剂|氢氧化铝粉-淄博同心材料有限公司 | 上海阳光泵业制造有限公司 -【官方网站】 | 缓蚀除垢剂_循环水阻垢剂_反渗透锅炉阻垢剂_有机硫化物-郑州威大水处理材料有限公司 | 赛默飞Thermo veritiproPCR仪|ProFlex3 x 32PCR系统|Countess3细胞计数仪|371|3111二氧化碳培养箱|Mirco17R|Mirco21R离心机|仟诺生物 | 塑料薄膜_PP薄膜_聚乙烯薄膜-常州市鑫美新材料包装厂 | 防火窗_耐火窗_防火门厂家_防火卷帘门-重庆三乐门业有限公司 | 硅胶管挤出机厂家_硅胶挤出机生产线_硅胶条挤出机_臣泽智能装备 贵州科比特-防雷公司厂家提供贵州防雷工程,防雷检测,防雷接地,防雷设备价格,防雷产品报价服务-贵州防雷检测公司 | 铝镁锰板_铝镁锰合金板_铝镁锰板厂家_铝镁锰金属屋面板_安徽建科 | 超声波流量计_流量标准装置生产厂家 _河南盛天精密测控 | 锥形螺带干燥机(新型耙式干燥机)百科-常州丰能干燥工程 | 滑板场地施工_极限运动场地设计_滑板公园建造_盐城天人极限运动场地建设有限公司 | 防堵吹扫装置-防堵风压测量装置-电动操作显示器-兴洲仪器 | 甲级防雷检测仪-乙级防雷检测仪厂家-上海胜绪电气有限公司 | 广州展台特装搭建商|特装展位设计搭建|展会特装搭建|特装展台制作设计|展览特装公司 | 报警器_家用防盗报警器_烟雾报警器_燃气报警器_防盗报警系统厂家-深圳市刻锐智能科技有限公司 |