-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
新時代·技術新未來深入淺出R語言數據分析 版權信息
- ISBN:9787302543886
- 條形碼:9787302543886 ; 978-7-302-54388-6
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
新時代·技術新未來深入淺出R語言數據分析 本書特色
8年實戰經驗,帶你搞定R語言數據分析,有理論,有應用,有技巧 系統:從數據讀取、網絡爬蟲,到數據分析方法,應有盡有 全面:介紹了*常用的12種數據分析方法 實戰:針對每種方法,都給出了實現代碼,拿來就用 圖解:提供了59張數據分析圖,方便讀者學習 免費提供配套學習視頻+源程序下載
新時代·技術新未來深入淺出R語言數據分析 內容簡介
本書首先介紹數據分析的方法論,然后介紹數據分析的相關模型方法,并進一步通過數據分析案例,講解數據分析的思維、方法及模型實現過程。本書重點介紹R語言在數據分析方面的應用,讓讀者能夠快速地使用R語言進行數據分析、構建模型。 本書分為17章,內容包括:使用R語言獲取數據、數據分析中的數據處理與數據探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關聯規則、隨機森林、支持向量機、神經網絡、文本挖掘、社交網絡分析,以及關于R語言數據分析的兩個延伸內容:H2O機器學習和R語言爬蟲。 本書內容通俗易懂,案例豐富,實用性強,特別適合R語言的入門讀者和進階讀者閱讀,也適合數據分析人員、數據挖掘人員等其他數據科學從業者。另外,本書也適用于統計學、計算機、機器學習、數學等相關專業的本科生、研究生使用。
新時代·技術新未來深入淺出R語言數據分析 目錄
第1章 數據分析項目的流程
1.1 數據分析項目中的角色
1.2 數據分析項目的階段
1.2.1 制定目標
1.2.2 收集數據
1.2.3 數據處理和分析
1.2.4 構建模型
1.2.5 評估模型
1.2.6 展示結果
1.2.7 部署與維護模型
1.3 總結
第2章 數據的讀取
2.1 RData數據
2.2 readr高效讀取數據
2.3 讀取Excel數據
2.4 讀取SPSS、SAS、STATA數據
2.5 R語言操作數據庫
2.6 總結
第3章 數據探索
3.1 缺失值的識別與處理
3.1.1 缺失值的識別與描述性統計
3.1.2 缺失值的可視化展示
3.1.3 缺失值的處理方法
3.2 異常值
3.3 dlookr數據處理包
3.3.1 所有變量的一般性診斷
3.3.2 數值型變量的診斷
3.3.3 分類變量的診斷
3.3.4 異常值的診斷
3.3.5 創建診斷報告
3.3.6 數據處理
3.3.7 缺失值處理
3.3.8 異常值處理
3.3.9 數據轉換
3.3.10 數據分箱
3.3.11 創建數據轉換報告
3.4 數據相關性
3.5 自動化創建數據探索報告
3.6 總結
第4章 生存分析
4.1 生存分析的基本內容
4.2 使用R 語言進行生存分析
4.3 非參數模型
4.3.1 使用Kaplan-Meier 方法擬合數據
4.3.2 Kaplan-Meier 方法的可視化
4.4 半參數模型生存分析方法
4.4.1 構建Cox 模型
4.4.2 檢查假設
4.4.3 Coxph 模型可視化
4.4.4 預測
4.4.5 分層
4.5 參數模型
4.6 隨機生存森林模型
4.7 總結
第5章 主成分分析
5.1 概述
5.1.1 維度相關的問題
5.1.2 檢測多重共線性
5.1.3 方差膨脹因子
5.2 主成分分析詳解
5.2.1 主成分分析的定義
5.2.2 主成分分析的簡單原理
5.2.3 主成分分析的算法
5.3 使用R 語言進行主成分分析
5.3.1 主成分分析的實現
5.3.2 主成分分析案例
5.4 總結
第6章 多維縮放
6.1 MDS 的工作原理
6.3 MDS 的優點
6.2 在R 語言中實現MDS
6.4 總結
第7章 線性回歸模型
7.1 線性回歸模型概述
7.2 在R 語言中實現回歸模型
7.2.1 圖形分析
7.2.2 建立線性模型
7.2.3 回歸模型的圖形診斷
7.2.4 預測模型
7.2.5 抽樣方法
7.3 總結
第8章 邏輯回歸模型
8.1 邏輯回歸的原理
8.2 在R 語言中實現邏輯回歸模型
8.2.1 數據探索
8.2.2 構建邏輯回歸模型
8.2.3 邏輯回歸預測
8.2.4 邏輯回歸模型評估
8.3 總結
第9章 聚類模型
9.1 概述
9.1.1 聚類算法
9.1.2 K均值聚類的原理
9.2 在R 語言中實現聚類模型
9.2.1 K均值聚類
9.2.2 層次聚類
9.2.3 Medoids 聚類(PAM)
9.3 總結
第10章 關聯規則
10.1 關聯規則概述
10.2 關聯規則的基本概念
10.3 在R 語言中實現關聯規劃
10.3.1 訓練模型
10.3.2 模型的評估
10.3.3 提升關聯規則的效果
10.3.4 關聯規則的可視化
10.4 總結
第11章 隨機森林
11.1 隨機森林的基本概念
11.3 總結
11.2 在R 語言中實現隨機森林
第12章 支持向量機
12.1 概述
12.3 總結
12.2 在R語言中實現支持向量機
第13章 神經網絡
13.2.2 評估模型效果
13.1 概述
13.2 在R 語言中實現神經網絡
13.3 總結
13.2.1 構建神經網絡模型
第14章 文本挖掘
14.1 概述
14.2 text2vec 背景及其基本原理
14.3 DTM 與TFIDF 的原理和實現
14.3.1 DTM 和TFIDF 的原理
14.3.2 DTM 的實現
14.3.3 TFIDF 的實現
14.4 情感分析
14.5 LDA 主題模型及其實現
14.6 構建自動問答系統
14.7 總結
第15章 社交網絡分析
15.1 社交網絡概述
15.2 igraph 簡介
15.2.1 準備工作
15.2.2 圖的指標計算
15.3 社交網絡的常見結構
15.4 社交網絡分析算法
15.4.1 Girvan-Newman
15.4.2 基于傳播標簽的社區檢測
15.4.3 基于貪婪優化模塊的社區檢測
15.4.4 自旋轉玻璃社群
15.5 微博社交群體分析
15.5.1 自旋轉玻璃社群
15.5.2 社群檢測
15.6 總結
第16章 H2O 機器學習
16.1 H2O 機器學習平臺
16.2 在R 語言中使用H2O
16.2.1 H2O 的安裝
16.2.2 案例應用
16.2.3 H2O 常用API
16.2.4 模型的通用參數
16.2.5 參數調整
16.3 H2O Flow
16.3.1 H2O Flow 的安裝
16.3.2 H2O Flow 的基本使用方法
16.4 總結
第17章 R語言爬蟲
17.1 快速爬取網頁數據
17.2 rvest 簡介
17.2.1 rvest API
17.2.2 rvest API 詳解
17.3 爬取BOSS 直聘數據
17.4 模擬登錄
新時代·技術新未來深入淺出R語言數據分析 作者簡介
米霖,畢業于華中農業大學,本科數學專業,研究生統計學專業,8年R語言項目經驗,擅長機器學習、統計模型。曾開發了多門R語言相關課程,課程包括“Shiny初級教程”“R包開發”“H20機器學習模型”“信用評分模型開發”“R語言文本挖掘”等,學員累計超過5000人。完成過很多數據分析項目,例如廣告虛假流量識別項目(通過虛假流量數據的挖掘幫助企業節省了上百萬元的營銷成本)、信貸中的信用評分項目、電商風控項目等。
- >
煙與鏡
- >
伊索寓言-世界文學名著典藏-全譯本
- >
朝聞道
- >
二體千字文
- >
山海經
- >
羅庸西南聯大授課錄
- >
史學評論
- >
巴金-再思錄