-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
現代數據科學(R語言·第2版) 版權信息
- ISBN:9787302598794
- 條形碼:9787302598794 ; 978-7-302-59879-4
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
現代數據科學(R語言·第2版) 本書特色
《現代數據科學(R語言●第2版)》是面向本 科生的綜合性數據科學教材,通過結合使用統計 和計算方式來解決現實中的數據問題。本書不 僅專注于案例或編程語法,還講述如何利用 R/RStudio計算環境中的統計編程,從各種數據中 提取有意義的信息,進而解決重大問題。
現代數據科學(R語言·第2版) 內容簡介
本書對上一版做了全面更新,與日益強 大的tidyverse套包保持同步,納入sf、purrr、 tidymodels和tidytext等包中的新功能。代碼的內 容和格式都經過修改,以方便閱讀和理解。部分 章節被拆分、重新組織和重新構思,以適應不斷 變化的實踐環境。
現代數據科學(R語言·第2版) 目錄
第Ⅰ部分 數據科學簡介
第1章 序言:為什么有數據科學? 2
1.1 數據科學是什么 3
1.2 案例學習:棒球資料統計分析
的演變 5
1.3 數據集 6
1.4 擴展資源 7
第2章 數據可視化 8
2.1 2012年聯邦大選周期 8
2.1.1 這兩組數據有區別嗎? 10
2.1.2 圖形變化 11
2.1.3 檢查變量之間的關系 12
2.1.4 網絡 14
2.2 組成數據圖形 15
2.2.1 數據圖形分類 15
2.2.2 顏色 17
2.2.3 剖析數據圖形 19
2.3 數據圖形的重要性:
挑戰者號 21
2.4 創建有效的演示 25
2.5 更廣闊的數據可視化世界 25
2.6 擴展資源 27
2.7 練習題 28
2.8 附加練習 29
第3章 圖形語法 30
3.1 數據圖形語法 30
3.1.1 畫面 31
3.1.2 刻度 33
3.1.3 指南 35
3.1.4 方面 35
3.1.5 層次 36
3.2 R中的規范數據圖形 38
3.2.1 單變量顯示 38
3.2.2 多元顯示 40
3.2.3 地圖 46
3.2.4 網絡 46
3.3 擴展示例:歷史嬰兒名字 47
3.3.1 至今仍活著的人口的
百分比 48
3.3.2 *普通的女性名字 53
3.4 擴展資源 56
3.5 練習題 56
3.6 附加練習 58
第4章 在一張表中整理數據 59
4.1 數據整理語法 59
4.1.1 select()和filter() 59
4.1.2 mutate()和rename() 62
4.1.3 arrange() 64
4.1.4 用group_by()進行
summarize() 66
4.2 擴展示例:Ben在大都會隊
(Mets)的時間 67
4.3 擴展資源 75
4.4 練習題 76
4.5 附加練習 79
第5章 多張表的數據整理 80
5.1 inner_join() 80
5.2 left_join() 82
5.3 擴展示例:Manny Ramirez 83
5.4 擴展資源 90
5.5 練習題 90
5.6 附加練習 92
第6章 數據規整 93
6.1 規整數據 93
6.1.1 動機 93
6.1.2 規整的數據是什么 95
6.2 重塑數據 101
6.2.1 用于從寬到窄以及從窄到
寬轉換的數據動詞 103
6.2.2 pivot_wider()函數 103
6.2.3 pivot_longer()函數 103
6.2.4 list-column 104
6.2.5 示例:中性姓名 108
6.3 命名約定 110
6.4 數據獲取 111
6.4.1 數據表友好的格式 111
6.4.2 API 115
6.4.3 清洗數據 115
6.4.4 示例:日本核反應堆 121
6.5 擴展資源 124
6.6 練習題 124
6.7 附加練習 127
第17章 使用地理空間數據 348
17.1 動機:地理空間數據有什么了不起的? 348
17.2 空間數據結構 351
17.3 制作地圖 353
17.3.1 靜態地圖 353
17.3.2 投影 354
17.3.3 基于leaflet的動態地圖 360
17.4 擴展示例:國會選區 362
17.4.1 選舉結果 362
17.4.2 國會選區 365
17.4.3 整合所有數據 367
17.4.4 使用ggplot2 368
17.4.5 使用leaflet 369
17.5 有效的地圖:如何避免撒謊 370
17.6 投影多邊形 371
17.7 有效利用其他技術 373
17.8 擴展資源 374
17.9 練習題 374
17.10 附加練習 374
第18章 地理空間計算 375
18.1 地理空間操作 375
18.1.1 地理編碼、路線和距離 375
18.1.2 幾何運算 378
18.2 地理空間聚合 384
18.3 地理空間聯接 386
18.4 拓展示例:MacLeish中的路徑海拔 387
18.5 擴展資源 391
18.6 練習題 391
18.7 附加練習 392
第19章 文本數據 393
19.1 使用Macbeth的正則表達式 393
19.1.1 解析蘇格蘭戲劇文本 393
19.1.2 Macbeth中的生與死 397
19.2 擴展示例:分析arXiv.org的文本數據 399
19.2.1 語料庫 402
19.2.2 詞云 404
19.2.3 情感分析 405
19.2.4 bigrams和N-grams 407
19.2.5 文檔詞項矩陣 408
19.3 獲取文本 412
19.4 擴展資源 415
19.5 練習題 416
19.6 附加練習 418
第20章 網絡科學 419
20.1 網絡科學引言 419
20.1.1 定義 419
20.1.2 網絡科學簡史 420
20.2 擴展示例:Kristen Stewart的六度空間理論 424
20.2.1 收集好萊塢數據 424
20.2.2 構建好萊塢網絡 427
20.2.3 建立Kristen Stewart預言 430
20.3 PageRank 433
20.4 擴展示例:1996年男子大學籃球賽 435
20.5 擴展資源 442
20.6 練習題 442
20.7 附加練習 443
第21章 結束語:走向“大數據” 444
21.1 大數據的一些概念 444
21.2 更大數據的工具 446
21.2.1 大數據的數據和內存結構 446
21.2.2 編譯 447
21.2.3 并行和分布式計算 447
21.2.4 SQL的替代方案 454
21.3 R的替代方案 455
21.4 結束語 456
21.5 擴展資源 456
第Ⅳ部分 附錄
附錄A 本書使用的包 458
附錄B R和RStudio簡介 465
附錄C 算法思維 483
附錄D 可再現性分析和工作流程 495
附錄E 回歸建模 504
附錄F 安裝數據庫服務器 524
現代數據科學(R語言·第2版) 作者簡介
Benjamin S. Baumer是美國史密斯學院統計與數據科學專業的副教授。Benjamin 于2004年成為紐約大都會隊第一位全職統計分析師,此后一直擔任應用數據科學家。Benjamin曾榮獲美國棒球研究學會頒發的2019年Waller教育獎和2016年突出貢獻者獎,參與撰寫了TheSabermetric Revolution-書。 Daniel T. Kaplan是美國瑪卡萊斯特學院數學和計算機科學系的名譽教授,是多本統計建模和統計計算教科書的作者。Daniel獲 得2006年瑪卡萊斯特學院卓越教學獎和2017年終身成就獎。 Nicholas J. Horton是美國阿默斯特學院統計和數據科學系的教授,是ASA和AAAS的高級會員,美國國家科學院應用與理論統計委員會的聯合主席,多項美國國家教學獎的獲得者,一系列統計計算書籍的作者,并積極參與編寫數據科學課程,幫助學生“用數據思考"。
- >
推拿
- >
回憶愛瑪儂
- >
小考拉的故事-套裝共3冊
- >
月亮虎
- >
中國歷史的瞬間
- >
月亮與六便士
- >
上帝之肋:男人的真實旅程
- >
我從未如此眷戀人間