-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
R語言數據分析:基礎、算法與實戰 版權信息
- ISBN:9787122436009
- 條形碼:9787122436009 ; 978-7-122-43600-9
- 裝幀:平裝
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
R語言數據分析:基礎、算法與實戰 本書特色
本書主要具有以下特色: 1.內容全面,循序漸進。本書圍繞R語言數據分析相關語法和常用數據分析包展開,內容由淺入深,非常適合初學者學習。 2.案例豐富,實用性強。書中選取了不同場合下的各種數據分析案例,不僅中間穿插有小案例,書末還有綜合性的大案例,通過案例實操,讓讀者能夠快速掌握所學知識,并應用到實際工作中。 3.全彩圖解,直觀易懂。本書采用全彩印刷,書中通過大量的彩色圖片展示,讓讀者一目了然,迅速了解并掌握具體的操作方法、步驟以及實現效果。 4.學習資源,超值贈送。重要知識點及實戰案例均配有二維碼視頻講解,掃碼觀看,學習更便捷。此外,還附贈相關實例素材源文件、電子書等資源,方便實踐練習與知識拓展。
R語言數據分析:基礎、算法與實戰 內容簡介
本書基于主流統計分析編程語言R,介紹了常用的數據分析方法及其實戰應用,內容涵蓋了R語言的使用、基于ggplot2包及其拓展包的數據可視化、數據的清洗與探索、數據分析、數據挖掘以及統計分析方法等。本書在講解數據分析時,主要基于tidyverse系列包進行數據整理、操作與可視化,基于tidymodels系列包進行數據分析、統計分析、機器學習等算法的應用,其它的R包用于數據分析的輔助。使用R語言時,遵循更新更簡潔的編程方式。本書內容循序漸進,講解通俗易懂,同時配套源程序和數據文件,讀者可以邊學邊實踐。本書可供從事數據分析、數據可視化、機器學習的科研及技術人員閱讀使用,也可作為高等院校中統計學、計算機科學等相關專業的教材。
R語言數據分析:基礎、算法與實戰 目錄
1.1 R與RStudio安裝 002
1.1.1 R語言安裝 002
1.1.2 RStudio安裝 003
1.1.3 R包安裝 005
1.2 數據分析簡介 007
1.2.1 數據分析的內容 007
1.2.2 數據分析工作流程 010
1.2.3 什么是數據分析師 012
1.2.4 數據分析師需要的技術和知識 012
1.3 R語言與數據分析 012
1.3.1 R語言為何適合數據分析 012
1.3.2 R語言常用數據分析包 013
1.4 本章小結 016
第2章 R語言快速入門 017
2.1 向量的數據類型 018
2.1.1 數值型 018
2.1.2 邏輯值型 020
2.1.3 字符型 020
2.1.4 因子型 022
2.2 矩陣與高維數組 023
2.2.1 矩陣 023
2.2.2 高維數組 025
2.3 數據框與列表 027
2.3.1 數據框 027
2.3.2 列表 030
2.4 條件判斷與循環語句 032
2.4.1 條件判斷語句 032
2.4.2 循環語句 033
2.5 編寫自己的函數 035
2.6 本章小結 037
第3章 R語言數據管理與操作 039
3.1 數據導入與保存 040
3.1.1 數據導入 040
3.1.2 數據保存 042
3.2 處理缺失值 042
3.2.1 缺失值發現 043
3.2.2 缺失值填充 044
3.3 數據操作 046
3.3.1 數據并行計算 046
3.3.2 數據選擇、過濾、分組 050
3.3.3 數據融合 059
3.3.4 進行長寬數據轉換 061
3.4 其它數據處理 062
3.4.1 lubridate包處理時間數據 062
3.4.2 stringr包處理文本數據 066
3.5 本章小結 072
第4章 R語言數據可視化 073
4.1 R語言基礎繪圖系統 074
4.1.1 基礎繪圖系統可視化基本設置 074
4.1.2 基礎繪圖系統可視化實戰 078
4.2 ggplot2包數據可視化 084
4.2.1 使用圖層構建圖像 085
4.2.2 ggplot2可視化進階 092
4.3 R語言其它數據可視化包 100
4.3.1 GGally包數據可視化 100
4.3.2 ggChernoff包數據可視化 103
4.3.3 ggTimeSeries包數據可視化 104
4.3.4 pheatmap包數據可視化 106
4.3.5 igraph包數據可視化 108
4.3.6 wordcloud包數據可視化 111
4.3.7 ComplexUpset包數據可視化 112
4.4 本章小結 114
第5章 R語言數據分析 115
5.1 相關性分析 116
5.1.1 相關系數介紹 116
5.1.2 相關系數計算與可視化分析 117
5.2 方差分析 118
5.2.1 單因素方差分析 118
5.2.2 雙因素方差分析 120
5.3 降維 123
5.3.1 常用數據降維算法 123
5.3.2 數據降維實戰 125
5.4 回歸分析 133
5.4.1 常用回歸算法 133
5.4.2 回歸評價指標 135
5.4.3 數據回歸實戰 136
5.5 分類 147
5.5.1 常用分類算法 147
5.5.2 分類評價指標 153
5.5.3 數據分類實戰 154
5.6 聚類 165
5.6.1 常用數據聚類算法 165
5.6.2 聚類評價指標 168
5.6.3 數據聚類實戰 168
5.7 時間序列預測 173
5.7.1 時序預測的相關模型 173
5.7.2 時間序列預測實戰 176
5.8 本章小結 185
第6章 綜合案例1:中藥材鑒別 187
6.1 聚類算法鑒別藥材種類 189
6.1.1 數據探索與可視化 189
6.1.2 數據降維與特征提取 192
6.1.3 數據聚類 193
6.2 分類算法鑒別藥材的產地 195
6.2.1 數據導入與探索 195
6.2.2 選擇數據中的重要特征 197
6.2.3 鑒別藥材的產地 200
6.3 分類算法鑒別藥材的類別 202
6.3.1 數據導入與探索 202
6.3.2 數據特征降維 204
6.3.3 預測藥材的類別 205
6.4 分類算法預測藥材的產地 210
6.4.1 數據導入與探索 210
6.4.2 數據特征降維 212
6.4.3 預測藥材的產地 213
6.5 本章小結 220
第7章 綜合案例2:抗乳腺癌候選藥物分析 221
7.1 數據特征提取 224
7.1.1 數據可視化探索 225
7.1.2 特征選擇 228
7.2 回歸模型預測生物活性 232
7.2.1 利用隨機森林提取的特征建立回歸模型 232
7.2.2 利用Lasso回歸提取的特征建立回歸模型 235
7.3 分類模型預測二分類變量 236
7.3.1 通過遞歸特征消除提取特征建立分類模型 236
7.3.2 通過主成分降維提取特征建立分類模型 241
7.4 本章小結 244
第8章 綜合案例3:文本內容數據分析 245
8.1 文本預處理 248
8.1.1 讀取文本數據 248
8.1.2 文本數據清洗 249
8.2 特征提取與可視化 252
8.2.1 TF特征 253
8.2.2 TF-IDF特征 254
8.2.3 詞云可視化 255
8.3 文本聚類 256
8.3.1 LDA主題模型聚類 256
8.3.2 K均值聚類 261
8.4 對文本進行分類 264
8.4.1 基于TF-IDF特征建立分類模型 264
8.4.2 基于TF特征建立分類模型 266
8.5 中文文本數據分析 268
8.5.1 《三國演義》文本數據預處理 269
8.5.2 對文本數據探索與特征提取 270
8.5.3 建立LDA主題模型 273
8.6 本章小結 276
參考文獻 277
- >
月亮虎
- >
經典常談
- >
巴金-再思錄
- >
推拿
- >
詩經-先民的歌唱
- >
羅庸西南聯大授課錄
- >
【精裝繪本】畫給孩子的中國神話
- >
回憶愛瑪儂