-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
大數據應用與技術叢書R統計高級編程和數據模型:分析.機器學習和可視化 版權信息
- ISBN:9787302557005
- 條形碼:9787302557005 ; 978-7-302-55700-5
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
大數據應用與技術叢書R統計高級編程和數據模型:分析.機器學習和可視化 本書特色
《R統計高級編程和數據模型 分析、機器學習和可視化》介紹使用R語言進行統計分析的各種高級方法,如廣義可加模型、混合效應模型、多重插補以及數據缺失處理技術。本書前幾章介紹相關技術的背景知識,然后給出一些具體實例,這些實例展示了如何使用R語言獲得期望的結果。 本書還向讀者介紹如何使用流行的R語言進行數據分析,讀者可以鉆研統計測試和統計技術的先決條件,通過實例掌握將R語言應用于高級數據分析的技術。本書是使用和編寫R語言程序的**手冊和參考書。
大數據應用與技術叢書R統計高級編程和數據模型:分析.機器學習和可視化 內容簡介
● 如何使用R語言進行不錯數據分析,涉及的技術包括廣義線性模型、廣義可加模型、混合效應模型、機器學習、并行處理 ● 如何使用R語言的數據可視化技術實現回歸,如線性回歸和不錯回歸,并了解回歸樣條和可加模型 ● 如何使用R語言實現機器學習,包含平行處理、降維、特征選取和分類 ● 如何使用R語言的多重插補技術解決數據缺失問題 ● 如何使用廣義線性可加模型實現普通量、二值量和計次量的輸出,如何使用自采樣法(Bootstrapping)分析不確定性 ● 學習如何對個體內的變異性進行建模,進而捕捉個體在方法以及時間穩定性上的差異
大數據應用與技術叢書R統計高級編程和數據模型:分析.機器學習和可視化 目錄
第1章 單變量數據可視化 1
1.1 分布 2
1.1.1 可視化觀測數據的分布 2
1.1.2 堆積點陣圖與直方圖 2
1.1.3 經驗密度圖 4
1.1.4 比較觀測分布與期望分布 6
1.1.5 Q-Q圖 7
1.1.6 比較經驗密度圖與期望分布的密度圖 10
1.1.7 其他分布的擬合 11
1.2 異常值 16
1.3 小結 23
第2章 多變量數據可視化 25
2.1 分布 25
2.2 奇異值 30
2.3 變量之間的關系 33
2.4 小結 45
第3章 GLM Ⅰ 47
3.1 概念背景 48
3.2 分類預測器和虛擬編碼 49
3.2.1 二級分類預測器 49
3.2.2 三級或三級以上的分類預測值 50
3.3 交互作用和調節效應 52
3.4 公式接口 53
3.5 方差分析 55
3.5.1 概念背景 55
3.5.2 R語言的ANOVA函數 58
3.6 線性回歸 61
3.6.1 概念背景 61
3.6.2 R語言中的線性回歸 62
3.6.3 高性能線性回歸 76
3.7 控制混合影響 78
3.8 案例研究:多線性回歸與交互作用 86
3.9 小結 93
第4章 GLM Ⅱ 95
4.1 概念背景 96
4.1.1 Logistic回歸 96
4.1.2 計數回歸 97
4.2 R程序示例 99
4.2.1 二項Logistic回歸 99
4.2.2 有序Logistic回歸 106
4.2.3 多分類Logistic回歸 109
4.2.4 泊松回歸和負二項回歸 113
4.3 案例研究:多項Logistic回歸 119
4.4 小結 127
第5章 廣義可加模型 129
5.1 概念背景 130
5.2 R語言中的GAM模型 136
5.2.1 高斯因變量 136
5.2.2 二值因變量 159
5.2.3 無序因變量 164
5.2.4 計數因變量 168
5.3 小結 176
第6章 機器學習:引言 179
6.1 訓練數據和驗證數據 180
6.2 重采樣和交叉驗證 186
6.3 自采樣法 189
6.4 并行處理和隨機數 191
6.5 小結 198
第7章 機器學習:無監督學習 201
7.1 數據背景和探索性分析 202
7.2 k-均值聚類算法 212
7.3 層次聚類算法 223
7.4 主成分分析 235
7.5 非線性聚類分析 245
7.6 小結 246
第8章 機器學習:監督學習 249
8.1 數據準備 250
8.1.1 獨熱編碼 252
8.1.2 定標化與中心化 254
8.1.3 變換 255
8.1.4 訓練數據與驗證數據 260
8.1.5 主成分分析 261
8.2 監督學習模型 266
8.2.1 支持向量機 267
8.2.2 分類與回歸樹 276
8.2.3 隨機森林 282
8.2.4 隨機梯度提升 288
8.2.5 多層感知機 297
8.3 小結 318
第9章 缺失數據 321
9.1 概念背景 322
9.2 R示例 328
9.2.1 回歸模型與多重插補 332
9.2.2 多重插補與并行處理 342
9.2.3 使用隨機森林法實現多重插補 345
9.3 案例研究:使用RF實現多重插補 349
9.4 小結 360
第10章 GLMM:引言 361
10.1 多層數據 362
10.1.1 數據重整 363
10.1.2 日記研究數據集 365
10.2 描述性統計量 368
10.2.1 基本描述量 370
10.2.2 組內相關系數(ICC) 376
10.3 探索與假設 379
10.3.1 分布與奇異值 379
10.3.2 時間趨勢 384
10.3.3 自相關 386
10.3.4 假設 390
10.4 小結 395
第11章 GLMM:線性 397
11.1 理論 398
11.1.1 廣義線性混合模型 398
11.1.2 術語混合效應和多層次模型 401
11.1.3 統計推斷 402
11.1.4 效應量 403
11.1.5 隨機截距模型 404
11.1.6 可視化隨機效應 404
11.1.7 解釋隨機截距模型 409
11.1.8 隨機截距斜率模型 416
11.1.9 將截距和斜率作為因變量 420
11.2 R示例 425
11.2.1 隨機截距的線性混合模型 425
11.2.2 隨機截距和隨機斜率的線性混合模型 437
11.3 小結 453
第12章 GLMM:高級 457
12.1 概念背景 458
12.2 Logistic廣義線性混合模型 458
12.2.1 隨機截距 458
12.2.2 隨機截距和隨機斜率 463
12.3 泊松分布和負二項分布GLMM 467
12.3.1 隨機截距 467
12.3.2 隨機截距和隨機斜率 477
12.4 小結 486
第13章 建模IIV 489
13.1 概念背景 490
13.1.1 貝葉斯推斷 490
13.1.2 什么是IIV 490
13.1.3 將IIV作為預測量 495
13.1.4 軟件實現:VARIAN 499
13.2 R程序示例 500
13.3 小結 508
大數據應用與技術叢書R統計高級編程和數據模型:分析.機器學習和可視化 作者簡介
Matt Wiley 數學專業終身副教授,他在數學教育和學生培養方面獲得過許多獎項。Matt在加州大學和得克薩斯 A&M大學獲得了理論數學學位、計算機科學學位和工商管理學位。他是維多利亞學院質量提升項目的主任,負責學院綜合評估、關鍵績效指標管理、一鍵式報表生成器和校園師生數據咨詢等工作。他還兼職Elkhart集團有限責任公司的管理工作,是該公司的數據咨詢師。Matt在R語言、SQL、C++、Ruby、Fortran和JavaScript等語言方面具有豐富的編程經驗。他喜歡把自己的熱情融入程序設計中,從邏輯問題求解和數據科學中找到樂趣。從董事會會議室到教室,他總是能找到合適的方法來與不同學科和不同領域的團隊建立起良好的合作關系,他總是能把復雜的思想和項目變得容易理解和解決。 Joshua F.Wiley 莫納什大學認知與臨床神經科學學院和心理學學院講師,他在加州大學洛杉磯分校獲得了博士學位,并在初級保健和預防領域完成了博士后訓練。Joshua研究如何用先進的量化方法理解心理因素之間的動態關系、睡眠以及其他與身心健康有關的行為。他開發或與他人共同開發了眾多R語言包,如用于建立位置尺度結構化方程模型的varian包,能夠把R語言鏈接到商業軟件Mplus的MplusAutomation包,他還設計了許多數據分析函數和能夠加快JWileymisc處理速度的函數。 譯者簡介 吳文國 溫州大學計算機科學與人工智能學院副教授、博士,從事計算機專業基礎課教學工作,講授C程序設計、C++程序設計、Python程序設計、數據結構與算法等課程,研究方向是算法、數據挖掘和人工智能,他還翻譯了許多計算機專業的英文圖書。
- >
上帝之肋:男人的真實旅程
- >
山海經
- >
大紅狗在馬戲團-大紅狗克里弗-助人
- >
伯納黛特,你要去哪(2021新版)
- >
煙與鏡
- >
自卑與超越
- >
月亮虎
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)