-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
R語言與大數(shù)據(jù)編程實戰(zhàn) 版權(quán)信息
- ISBN:9787121326349
- 條形碼:9787121326349 ; 978-7-121-32634-9
- 裝幀:一般膠版紙
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>>
R語言與大數(shù)據(jù)編程實戰(zhàn) 本書特色
本書是一本R語言入門讀物,它旨在幫助讀者迅速構(gòu)建起與數(shù)據(jù)分析相關(guān)的知識體系,并學(xué)習(xí)如何使用R軟件實現(xiàn)數(shù)據(jù)分析方法。無論有無編程基礎(chǔ)或數(shù)學(xué)基礎(chǔ),本書都能幫助讀者成長為一名合格的數(shù)據(jù)分析師。本書全面介紹了來自統(tǒng)計分析、機器學(xué)習(xí)、人工智能等領(lǐng)域的多種數(shù)據(jù)分析算法,在講解與之相關(guān)的R代碼時,還討論了這些算法的原理、優(yōu)缺點與適用背景。本書按照由易到難的原則組織章節(jié)主題,讀者將獲得*好的閱讀體驗。通過閱讀本書,讀者將對R語言在數(shù)據(jù)分析領(lǐng)域的應(yīng)用有一個全面的認(rèn)識。這種認(rèn)識不被特定行業(yè)所局限,任何行業(yè)的讀者都能利用本書介紹的數(shù)據(jù)分析方法解決本行業(yè)的數(shù)據(jù)分析問題。
R語言與大數(shù)據(jù)編程實戰(zhàn) 內(nèi)容簡介
全面介紹了來自統(tǒng)計分析、機器學(xué)習(xí)、人工智能等領(lǐng)域的多種數(shù)據(jù)分析算法,在講解與之相關(guān)的 R代碼時,還討論了這些算法的原理、優(yōu)缺點與適用背景。本書按照由易到難的原則組織章節(jié)主題,讀者將獲得*好的閱讀體驗。
R語言與大數(shù)據(jù)編程實戰(zhàn) 目錄
第1章?R的基本介紹 1
1.1?強大的R 1
1.2?R語言在大數(shù)據(jù)中的應(yīng)用 2
1.2.1?R語言用戶行為分析 2
1.2.2?R語言處理金融大數(shù)據(jù) 3
1.2.3?R語言天氣數(shù)據(jù)可視化 4
1.2.4?R語言醫(yī)療大數(shù)據(jù)分析 4
1.3?R的安裝與啟動 5
1.3.1?安裝并啟動R 6
1.3.2?安裝并啟動一個IDE 7
1.4?R的向量、矩陣和數(shù)組 8
1.4.1?向量的操作方法和固有屬性 8
1.4.2?矩陣的操作和運算 10
1.4.3?數(shù)組中的維度函數(shù) 13
1.5?R的列表和數(shù)據(jù)框 14
1.5.1?列表的特性和編輯方法 14
1.5.2?數(shù)據(jù)框的創(chuàng)建和基本操作 17
1.6?R數(shù)據(jù)文件的載入和載出 19
1.6.1?結(jié)構(gòu)化純文本文件的讀取和輸出 19
1.6.2?其他文件的讀取和輸出 22
1.7?向R中安裝包 23
第2章?原始數(shù)據(jù)的探索與預(yù)處理 26
2.1?度量數(shù)據(jù)集的集中程度 26
2.2?度量數(shù)據(jù)集的分散程度 27
2.2.1?極值、方差和標(biāo)準(zhǔn)差 27
2.2.2?標(biāo)準(zhǔn)誤和偏度系數(shù)、峰度系數(shù) 29
2.3?創(chuàng)建一個數(shù)值摘要表 30
2.4?異常值的觀測與說明 32
2.4.1?利用箱線圖觀測異常值并處理 32
2.4.2?異常值檢測的其他情況和說明 34
2.5?缺失值的填補與處理 35
2.5.1?刪除缺失值或?qū)ζ溥M行簡單填補 36
2.5.2?按照相關(guān)性對空缺值進行填補 38
第3章?R的數(shù)據(jù)可視化 40
3.1?plot()函數(shù)和常用的圖形參數(shù) 40
3.1.1?設(shè)置plot()函數(shù)中的參數(shù) 40
3.1.2?修改散點圖的坐標(biāo)并加入標(biāo)注 43
3.2?經(jīng)典的基礎(chǔ)圖形及用途 45
3.2.1?線圖 45
3.2.2?直方圖 49
3.2.3?箱線圖和莖葉圖 52
3.3?將圖形組合起來 55
3.4?更多的高水平作圖函數(shù) 57
3.5?更多的常用作圖命令 59
第4章?R中參數(shù)的估計和檢驗 62
4.1?使用R進行點估計和區(qū)間估計 62
4.1.1?簡單的點估計和區(qū)間估計 62
4.1.2?估計單側(cè)置信區(qū)間 65
4.2?與正態(tài)總體有關(guān)的參數(shù)檢驗 68
4.3?列聯(lián)表與獨立性檢驗 71
4.4?幾種檢驗數(shù)據(jù)分布的函數(shù) 72
4.5?對非正態(tài)總體的區(qū)間估計和檢驗 75
4.5.1?非正態(tài)總體的區(qū)間估計 75
4.5.2?非參數(shù)檢驗中的符號檢驗 76
4.5.3?非參數(shù)檢驗中的秩檢驗 78
第5章?R中的方差分析 80
5.1?方差分析模型的建立 80
5.2?單因素方差分析 81
5.2.1?單因素方差分析的數(shù)學(xué)思想與模型 81
5.2.2?檢驗樣本是否滿足方差分析的假設(shè)條件 82
5.2.3?構(gòu)建單因素方差分析模型 84
5.3?多因素方差分析 87
5.3.1?多因素方差分析的數(shù)學(xué)思想與模型 87
5.3.2?不考慮交互作用的雙因素方差分析 88
5.3.3?考慮交互作用的雙因素方差分析 89
5.4?秩檢驗和協(xié)方差分析 91
5.4.1?對控制變量應(yīng)用秩檢驗方法 91
5.4.2?協(xié)方差分析的假設(shè)與應(yīng)用 92
第6章?R中的相關(guān)分析和回歸分析 94
6.1?多種相關(guān)系數(shù)的度量和分析 94
6.1.1?簡單相關(guān)系數(shù)的計算和檢驗 94
6.1.2?散布矩陣圖和偏相關(guān)系數(shù) 96
6.1.3?典型相關(guān)分析 98
6.2?線性回歸分析及其常規(guī)參數(shù) 99
6.2.1?對數(shù)據(jù)進行預(yù)處理 100
6.2.2?構(gòu)建**個回歸模型 101
6.2.3?修正方程并檢驗殘差 102
6.3?使用逐步回歸篩選自變量 104
6.3.1?逐步回歸的思想與分類 104
6.3.2?構(gòu)建逐步回歸模型 105
6.4?啞變量和邏輯回歸 107
6.4.1?啞變量和邏輯回歸的思想 107
6.4.2?向線性回歸模型中納入啞變量 108
第7章?更高級的數(shù)據(jù)可視化 110
7.1?基礎(chǔ)圖形的拓展與延伸 110
7.1.1?繪制分類散點圖并添加圖標(biāo) 110
7.1.2?繪制含多種類別的密度分布圖 112
7.1.3?復(fù)合條形圖和堆棧條形圖 114
7.2?有關(guān)多元分布函數(shù)的特殊圖形 117
7.2.1?星圖和臉譜圖 117
7.2.2?輪廓圖 120
7.2.3?調(diào)和曲線圖 122
7.3?建立*簡單的3D圖形 123
7.4?如何讓圖形更美觀 125
7.5?更多的繪圖包和系統(tǒng) 128
第8章?R中的聚類分析和判別分析 129
8.1?幾種聚類分析的異同 129
8.2?使用R實現(xiàn)KNN聚類 130
8.2.1?KNN算法的思想和模型 130
8.2.2?使用R實現(xiàn)KNN聚類 131
8.3?使用R實現(xiàn)系統(tǒng)聚類 133
8.3.1?系統(tǒng)聚類的思想和模型 133
8.3.2?使用R實現(xiàn)系統(tǒng)聚類 134
8.4?使用R實現(xiàn)快速聚類 136
8.4.1?快速聚類的思想和模型 136
8.4.2?使用R實現(xiàn)快速聚類 137
8.5?幾種判別分析模型綜述 140
8.5.1?距離判別模型 140
8.5.2?Fisher判別模型 142
第9章?R中的主成分分析和因子分析 145
9.1?主成分分析的實現(xiàn)與應(yīng)用 145
9.1.1?主成分分析的模型假設(shè)和數(shù)據(jù)處理 145
9.1.2?構(gòu)造一個主成分分析模型 147
9.1.3?計算主成分的綜合得分 149
9.2?因子分析的初次構(gòu)建與完善 150
9.2.1?構(gòu)造一個簡單的因子分析模型 150
9.2.2?計算因子得分并分析 152
9.3?對因子分析模型進行修正 153
9.3.1?修改因子分析模型中的因子個數(shù) 153
9.3.2?基于主成分法和主軸因子法進行因子分析 155
9.4?在降維分析的基礎(chǔ)上進行回歸分析和聚類分析 157
9.4.1?在降維分析的基礎(chǔ)上進行回歸分析 157
9.4.2?在降維分析的基礎(chǔ)上進行聚類分析 160
第10章?R中的廣義線性回歸模型 162
10.1?一般的廣義線性回歸模型 162
10.1.1?使用二次函數(shù)擬合線性回歸模型 162
10.1.2?擬合更多的廣義線性模型 164
10.1.3?比較線性模型的優(yōu)劣 166
10.2?Logistic線性回歸模型 168
10.2.1?Logistic模型的原理與構(gòu)建方法 168
10.2.2?Logistic模型的顯著性檢驗和優(yōu)勢比 170
10.2.3?修正被警告的Logistic模型 171
10.3?泊松回歸分析模型 173
10.3.1?擬合**個泊松回歸模型 174
10.3.2?泊松回歸模型的過散布檢驗 176
10.4?廣義線性模型的交叉驗證 178
第11章?R中的時間序列模型 180
11.1?將數(shù)據(jù)轉(zhuǎn)換為時間序列格式 180
11.1.1?使用ts()函數(shù)轉(zhuǎn)換數(shù)據(jù)格式并繪制時間序列曲線 180
11.1.2?使用zoo()函數(shù)轉(zhuǎn)換數(shù)據(jù)格式并繪制時間序列曲線 182
11.2?分解時間序列并檢驗時間序列的自相關(guān)性 185
11.2.1?使用經(jīng)典方法分解時間序列 185
11.2.2?使用STL方法分解時間序列 186
11.3?探究時間序列的自相關(guān)性 188
11.3.1?使用月圖和季度圖探究自相關(guān)性 188
11.3.2?使用散點圖探究自相關(guān)性 189
11.4?構(gòu)建時間序列并預(yù)測 191
11.4.1?均值預(yù)測、單純預(yù)測和漂移 192
11.4.2?不考慮長期趨勢和季節(jié)波動的簡單指數(shù)平滑 195
11.4.3?在指數(shù)平滑中加入長期趨勢和季節(jié)波動 196
11.4.4?自回歸移動平均模型 198
第12章?R中的*優(yōu)化問題 201
12.1?*優(yōu)化問題簡述 201
12.2?黃金分割法 202
12.2.1?黃金分割法和局部*優(yōu)解 202
12.2.2?使用R實現(xiàn)黃金分割法 203
12.3?牛頓*優(yōu)化方法 205
12.3.1?牛頓法的算法原理 206
12.3.2?在一維情形下實現(xiàn)牛頓迭代法 207
12.3.3?在多維情形下實現(xiàn)牛頓迭代法 209
12.4?*快上升法 210
12.4.1?利用梯度求解上升*快的相鄰點 210
12.4.2?構(gòu)建*快上升法函數(shù)并檢驗 212
12.5?R中的*優(yōu)化函數(shù) 213
第13章?使用R繪制地理信息圖形 216
13.1?繪制世界、國家、省市地圖 216
13.1.1?使用map()函數(shù)繪制地圖 216
13.1.2?另一種繪制地圖的方法 218
13.1.3?分省市繪制地圖 220
13.2?向地圖中添加顏色 222
13.2.1?向地圖中添加顏色前的準(zhǔn)備工作 222
13.2.2?在地圖上添加顏色 224
13.3?向地圖中添加標(biāo)簽和線條 226
13.3.1?向地圖中添加標(biāo)簽前的準(zhǔn)備工作 226
13.3.2?在地圖上添加標(biāo)簽 228
13.3.3?在地圖上添加線條 230
13.4?使用其他格式的文件優(yōu)化地圖 232
第14章?使用R構(gòu)建支持向量機 236
14.1?構(gòu)建一個簡單的支持向量機 236
14.1.1?支持向量機的算法原理 236
14.1.2?構(gòu)建一個簡單的支持向量機 238
14.1.3?使用其他核函數(shù)構(gòu)建支持向量機 241
14.2?優(yōu)化支持向量機的參數(shù) 243
14.2.1?優(yōu)化參數(shù)degree 244
14.2.2?優(yōu)化參數(shù)cost 247
14.2.3?優(yōu)化參數(shù)gamma 249
14.3?比較支持向量機與Logistic回歸的優(yōu)劣 252
14.4?比較支持向量機和KNN聚類算法的優(yōu)劣 255
第15章?實現(xiàn)更高效的流程控制和高級循環(huán) 257
15.1?R中的流程控制 257
15.1.1?if語句的多種實現(xiàn)方法 257
15.1.2?ifelse語句與花括號的結(jié)合 258
15.1.3?適合多分支情況的switch語句 260
15.2?R中的for循環(huán)、while循環(huán)和repeat循環(huán) 262
15.2.1?R中的for循環(huán)和while循環(huán) 262
15.2.2?R中的repeat循環(huán) 264
15.3?apply家族中的循環(huán)函數(shù) 266
15.3.1?R中的apply()函數(shù) 266
15.3.2?R中的lapply()函數(shù)和sapply()函數(shù) 269
15.3.3?R中的tapply()函數(shù) 271
15.3.4?R中的mapply()函數(shù) 274
15.4?更多的高級循環(huán)函數(shù) 276
15.4.1?R中的replicate()函數(shù)和sweep()函數(shù) 276
15.4.2?R中的aggregate()函數(shù) 279
第16章?R代碼的調(diào)試與優(yōu)化 282
16.1?R代碼的常見信息與警告 282
16.1.1?R代碼的正常信息與警告 282
16.1.2?R代碼中的警告處理方法 284
16.2?R代碼中的錯誤與錯誤處理方法 285
16.2.1?使用try()函數(shù)處理錯誤信息 285
16.2.2?將try()函數(shù)與循環(huán)相結(jié)合 287
16.3?調(diào)試R代碼 288
16.3.1?查看調(diào)用棧或暫停代碼 288
16.3.2?修改error選項 290
16.4?向量化編程方法 291
16.4.1?向量化編程思想 291
16.4.2?比較循環(huán)和向量的運行速度 292
第17章?構(gòu)建電影評分預(yù)測模型 295
17.1?獲取數(shù)據(jù)并探索 295
17.2?利用recommenderlab包處理數(shù)據(jù) 297
17.3?建立模型并評估 299
17.3.1?模型的選擇與建立 299
17.3.2?模型之間的比較和評估 301
第18章?貝葉斯垃圾郵件過濾器模型 303
18.1?貝葉斯模型中的條件概率 303
18.2?復(fù)雜的數(shù)據(jù)預(yù)處理過程 304
18.2.1?利用for循環(huán)讀入多封郵件正文 304
18.2.2?利用tm包進一步轉(zhuǎn)換數(shù)據(jù)格式 306
18.2.3?將TDM轉(zhuǎn)換成真正有用的數(shù)據(jù)框 307
18.3?利用occurrece值構(gòu)造分類器 309
18.3.1?完成理論準(zhǔn)備并處理測試郵件和普通郵件 309
18.3.2?創(chuàng)建一個函數(shù)
R語言與大數(shù)據(jù)編程實戰(zhàn) 作者簡介
李倩星:畢業(yè)于西南大學(xué)統(tǒng)計學(xué)專業(yè),對數(shù)據(jù)挖掘、機器學(xué)習(xí)以及人工智能領(lǐng)域有深刻的研究。主持翻譯了《傳播學(xué)中的大數(shù)據(jù):發(fā)展與不足》、《大數(shù)據(jù)、一個新興領(lǐng)域的誤區(qū)和方法與概念》、《數(shù)據(jù)挖掘揭示了差評導(dǎo)致的負(fù)反饋怪圈》等數(shù)十篇前沿科技文章,并發(fā)表于PPV課社區(qū)。
- >
中國人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
詩經(jīng)-先民的歌唱
- >
我從未如此眷戀人間
- >
姑媽的寶刀
- >
苦雨齋序跋文-周作人自編集
- >
山海經(jīng)
- >
回憶愛瑪儂
- >
有舍有得是人生