中图网(原中国图书网):网上书店,尾货特色书店,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >>
數據科學中的實用統計學 第2版

包郵 數據科學中的實用統計學 第2版

出版社:人民郵電出版社出版時間:2021-10-01
開本: 16開 頁數: 288
中 圖 價:¥49.9(5.0折) 定價  ¥99.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

數據科學中的實用統計學 第2版 版權信息

  • ISBN:9787115569028
  • 條形碼:9787115569028 ; 978-7-115-56902-8
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>>

數據科學中的實用統計學 第2版 本書特色

1.以通俗易懂的方式,從數據科學的角度系統的闡釋重要且實用的統計學概念,介紹如何將各種統計方法應用于數據科學中; 2.運用清晰的解釋和豐富的示例,將實用的統計學術語與數據挖掘實踐相結合,適用于數據科學的入門初學者; 3.相比于上一版,本書新增了更多Python和R語言示例,讀者可以更深入的了解如何在數據科學項目中正確運用各種統計方法; 4.通過本書,你將掌握以下知識: 為什么探索性數據分析是開啟數據科學任務的關鍵一步 隨機抽樣如何降低偏差并提高數據集的質量 實驗設計原則如何針對問題生成確定性答案 如何使用回歸方法估計結果并檢測異常 用于預測記錄所屬類別的主要分類方法 從數據中“學習”的統計機器學習方法 從未標記的數據中提取信息的無監督學習方法

數據科學中的實用統計學 第2版 內容簡介

本書解釋了數據科學中至關重要的統計學概念,并介紹了如何將各種統計方法應用于數據科學。作者以通俗易懂、分門別類的方式,闡釋了統計學中與數據科學相關的關鍵概念,并解釋了各統計學概念在數據科學中的重要性及有用程度。第2版在版的基礎上加入了更多以Python和R編寫的示例,更清楚地闡釋了如何將統計方法用于數據科學。本書適合對R和Python有一定了解的數據科學從業者閱讀。

數據科學中的實用統計學 第2版 目錄

目錄
第 1章 探索性數據分析 1
1.1 結構化數據的要素 2
1.2 矩形數據 4
1.2.1 數據框和索引 5
1.2.2 非矩形數據結構 6
1.2.3 擴展閱讀 6
1.3 位置估計 6
1.3.1 均值 8
1.3.2 中位數和健壯的估計 9
1.3.3 示例:人口和謀殺率的位置估計 10
1.3.4 擴展閱讀 11
1.4 變異性估計 11
1.4.1 標準差以及相關估計 13
1.4.2 基于百分位數的估計 14
1.4.3 示例:美國各州人口數量的變異性估計 15
1.4.4 擴展閱讀 16
1.5 探索數據分布 16
1.5.1 百分位數與箱線圖 17
1.5.2 頻數表和直方圖 18
1.5.3 密度圖和密度估計 20
1.5.4 擴展閱讀 22
1.6 探索二元數據和分類型數據 22
1.6.1 眾數 24
1.6.2 期望值 24
1.6.3 概率 25
1.6.4 擴展閱讀 25
1.7 相關性 25
1.7.1 散點圖 28
1.7.2 擴展閱讀 29
1.8 探索兩個及以上的變量 29
1.8.1 六邊形分箱圖和等高線圖(繪制數值型數據之間的關系) 30
1.8.2 兩個分類變量 32
1.8.3 分類型數據和數值型數據 33
1.8.4 多個變量的可視化 35
1.8.5 擴展閱讀 37
1.9 小結 37
第 2 章 數據與抽樣分布 39
2.1 隨機抽樣和樣本偏差 40
2.1.1 偏差 42
2.1.2 隨機選擇 43
2.1.3 數量和質量:什么時候數量更重要 44
2.1.4 樣本均值與總體均值 45
2.1.5 擴展閱讀 45
2.2 選擇偏差 45
2.2.1 均值回歸 46
2.2.2 擴展閱讀 48
2.3 統計量的抽樣分布 48
2.3.1 中心極限定理 51
2.3.2 標準誤差 51
2.3.3 擴展閱讀 52
2.4 Bootstrap 方法 52
2.4.1 重抽樣與Bootstrap 方法 55
2.4.2 擴展閱讀 55
2.5 置信區間 55
2.6 正態分布 57
2.7 長尾分布 60
2.8 學生的t 分布 62
2.9 二項分布 64
2.10 卡方分布 67
2.11 F 分布 68
2.12 泊松及其相關分布 68
2.12.1 泊松分布 69
2.12.2 指數分布 69
2.12.3 估計故障率 70
2.12.4 韋布爾分布 70
2.12.5 擴展閱讀 71
2.13 小結 71
第3 章 統計實驗與顯著性檢驗 72
3.1 A/B 測試 73
3.1.1 為什么要有對照組 75
3.1.2 為什么只有A/B,沒有C/D…… 76
3.1.3 擴展閱讀 77
3.2 假設檢驗 77
3.2.1 零假設 78
3.2.2 備擇假設 79
3.2.3 單向假設檢驗與雙向假設檢驗 79
3.2.4 擴展閱讀 80
3.3 重抽樣 80
3.3.1 置換檢驗 80
3.3.2 示例:Web 黏性 81
3.3.3 窮盡置換檢驗和Bootstrap 置換檢驗 84
3.3.4 置換檢驗:數據科學的底線 85
3.3.5 擴展閱讀 85
3.4 統計顯著性和p 值 85
3.4.1 p 值 88
3.4.2 α 88
3.4.3 第 一類錯誤和第二類錯誤 90
3.4.4 數據科學與p 值 9
3.4.5 擴展閱讀 90
3.5 t 檢驗 91
3.6 多重檢驗 92
3.7 自由度 95
3.8 ANOVA 97
3.8.1 F 統計量 99
3.8.2 雙向ANOVA 101
3.8.3 擴展閱讀 101
3.9 卡方檢驗 101
3.9.1 卡方檢驗:一種重抽樣方法 102
3.9.2 卡方檢驗:統計理論 104
3.9.3 費希爾精確檢驗 105
3.9.4 與數據科學的關聯 107
3.9.5 擴展閱讀 107
3.10 多臂老虎機算法 107
3.11 檢驗力與樣本容量 110
3.11.1 樣本容量 111
3.11.2 擴展閱讀 113
3.12 小結 114
第4 章 回歸與預測 115
4.1 簡單線性回歸 115
4.1.1 回歸方程 117
4.1.2 擬合值與殘差 119
4.1.3 *小二乘法 120
4.1.4 預測與解釋(分析) 121
4.1.5 擴展閱讀 121
4.2 多元線性回歸 122
4.2.1 示例:金縣房屋數據 123
4.2.2 模型評估 124
4.2.3 交叉驗證 126
4.2.4 模型選擇與逐步回歸 127
4.2.5 加權回歸 130
4.2.6 擴展閱讀 131
4.3 使用回歸進行預測 131
4.3.1 外推風險 131
4.3.2 置信區間與預測區間 132
4.4 回歸中的因子變量 133
4.4.1 虛擬變量的表示方法 134
4.4.2 多水平因子變量 136
4.4.3 有序因子變量 138
4.5 解釋回歸方程 138
4.5.1 相關的預測變量 139
4.5.2 多重共線性 140
4.5.3 混淆變量 141
4.5.4 交互作用與主效應 142
4.6 回歸診斷 143
4.6.1 離群點 144
4.6.2 強影響值 146
4.6.3 異方差、非正態與相關誤差 148
4.6.4 偏殘差圖與非線性 151
4.7 多項式回歸與樣條回歸 152
4.7.1 多項式回歸 153
4.7.2 樣條回歸 155
4.7.3 廣義可加模型 156
4.7.4 擴展閱讀 158
4.8 小結 158
第5 章 分類 159
5.1 樸素貝葉斯算法 160
5.1.1 為什么進行精確貝葉斯分類是不現實的 161
5.1.2 樸素貝葉斯問題求解 161
5.1.3 數值型預測變量 164
5.1.4 擴展閱讀 164
5.2 判別分析 164
5.2.1 協方差矩陣 165
5.2.2 費希爾線性判別分析 166
5.2.3 一個簡單的例子 166
5.2.4 擴展閱讀 169
5.3 邏輯回歸 169
5.3.1 邏輯響應函數和logit 函數 170
5.3.2 邏輯回歸和廣義線性模型 171
5.3.3 廣義線性模型 172
5.3.4 邏輯回歸的預測值 173
5.3.5 系數和優勢比的解釋 174
5.3.6 線性回歸與邏輯回歸:共性與差異 175
5.3.7 評估模型 176
5.3.8 擴展閱讀 179
5.4 分類模型評估 179
5.4.1 混淆矩陣 180
5.4.2 稀有類問題 182
5.4.3 精確度、召回率和特異度 182
5.4.4 ROC 曲線 183
5.4.5 AUC 185
5.4.6 提升度 186
5.4.7 擴展閱讀 187
5.5 非平衡數據的處理策略 187
5.5.1 欠采樣 188
5.5.2 過采樣與上(下)加權 189
5.5.3 數據生成 190
5.5.4 基于成本的分類 191
5.5.5 探索預測結果 191
5.5.6 擴展閱讀 192
5.6 小結 193
第6 章 統計機器學習 194
6.1 KNN 195
6.1.1 一個小例子:預測貸款違約 196
6.1.2 距離的度量 198
6.1.3 獨熱編碼 198
6.1.4 標準化(歸一化,z 分數) 199
6.1.5 K 的選擇 201
6.1.6 KNN 作為特征引擎 202
6.2 樹模型 204
6.2.1 一個簡單的例子 205
6.2.2 遞歸分割算法 207
6.2.3 測量同質性或不純度 208
6.2.4 讓樹停止生長 209
6.2.5 預測連續的值 211
6.2.6 如何使用樹 211
6.2.7 擴展閱讀 212
6.3 裝袋法與隨機森林 212
6.3.1 裝袋法 213
6.3.2 隨機森林 213
6.3.3 變量的重要性 217
6.3.4 超參數 220
6.4 提升方法 221
6.4.1 提升算法 222
6.4.2 XGBoost 222
6.4.3 正則化:避免過擬合 225
6.4.4 超參數與交叉驗證 228
6.5 小結 231
第7 章 無監督學習 232
7.1 主成分分析 233
7.1.1 一個簡單的例子 234
7.1.2 計算主成分 236
7.1.3 解釋主成分 236
7.1.4 對應分析 239
7.1.5 擴展閱讀 240
7.2 K-均值聚類 241
7.2.1 一個簡單的例子 241
7.2.2 K-均值算法 244
7.2.3 簇的解釋 245
7.2.4 選擇簇的數量 247
7.3 層次聚類 248
7.3.1 一個簡單的例子 249
7.3.2 樹狀圖 250
7.3.3 凝聚算法 251
7.3.4 測量相異度 252
7.4 基于模型的聚類 253
7.4.1 多元正態分布 253
7.4.2 混合正態分布 254
7.4.3 選擇簇的數量 257
7.4.4 擴展閱讀 259
7.5 數據縮放與分類變量 259
7.5.1 縮放變量 260
7.5.2 主導變量 261
7.5.3 分類數據和Gower 距離 263
7.5.4 混合數據聚類中的問題 265
7.6 小結 266
擴展閱讀 267
作者介紹 269
封面介紹 269
展開全部

數據科學中的實用統計學 第2版 作者簡介

彼得·布魯斯(Peter Bruce),Statistics.com統計學教育學院創辦人兼院長,重采樣統計軟件Resampling Stats的開發者,美國統計協會職業發展咨詢委員會成員。 安德魯·布魯斯(Andrew Bruce),亞馬遜數據科學家、華盛頓大學統計學博士,擁有30余年的統計學和數據科學經驗。 彼得·格德克(Peter Gedeck),數據科學家,擁有30余年的科學計算和數據科學經驗,善于開發機器學習算法。

商品評論(0條)
暫無評論……
書友推薦
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 超高频感应加热设备_高频感应电源厂家_CCD视觉检测设备_振动盘视觉检测设备_深圳雨滴科技-深圳市雨滴科技有限公司 | 中央空调温控器_风机盘管温控器_智能_液晶_三速开关面板-中央空调温控器厂家 | 深圳宣传片制作_产品视频制作_深圳3D动画制作公司_深圳短视频拍摄-深圳市西典映画传媒有限公司 | 电子万能试验机_液压拉力试验机_冲击疲劳试验机_材料试验机厂家-济南众标仪器设备有限公司 | 昆明网络公司|云南网络公司|昆明网站建设公司|昆明网页设计|云南网站制作|新媒体运营公司|APP开发|小程序研发|尽在昆明奥远科技有限公司 | 营养师网,营养师考试时间,报名入口—网站首页 | 小程序开发公司-小程序制作-微信小程序开发-小程序定制-咏熠软件 | 电采暖锅炉_超低温空气源热泵_空气源热水器-鑫鲁禹电锅炉空气能热泵厂家 | 安徽合肥格力空调专卖店_格力中央空调_格力空调总经销公司代理-皖格制冷设备 | 政府回应:200块在义乌小巷能买到爱情吗?——揭秘打工族省钱约会的生存智慧 | 博博会2021_中国博物馆及相关产品与技术博览会【博博会】 | 长沙中央空调维修,中央空调清洗维保,空气能热水工程,价格,公司就找维小保-湖南维小保环保科技有限公司 | 能量回馈_制动单元_电梯节能_能耗制动_深圳市合兴加能科技有限公司 | 底部填充胶_电子封装胶_芯片封装胶_芯片底部填充胶厂家-东莞汉思新材料 | 广东成考网-广东成人高考网 | 桁架机器人_桁架机械手_上下料机械手_数控车床机械手-苏州清智科技装备制造有限公司 | 一体化污水处理设备_生活污水处理设备_全自动加药装置厂家-明基环保 | 滚塑PE壳体-PE塑料浮球-警示PE浮筒-宁波君益塑业有限公司 | 北京翻译公司_同传翻译_字幕翻译_合同翻译_英语陪同翻译_影视翻译_翻译盖章-译铭信息 | 皮带输送机-大倾角皮带输送机-皮带输送机厂家-河南坤威机械 | 安平县鑫川金属丝网制品有限公司,防风抑尘网,单峰防风抑尘,不锈钢防风抑尘网,铝板防风抑尘网,镀铝锌防风抑尘网 | 骨龄仪_骨龄检测仪_儿童骨龄测试仪_品牌生产厂家【品源医疗】 | 云阳人才网_云阳招聘网_云阳人才市场_云阳人事人才网_云阳人家招聘网_云阳最新招聘信息 | 萃取箱-萃取槽-PVC萃取箱厂家-混合澄清槽- 杭州南方化工设备 | POS机办理_个人POS机免费领取 - 银联POS机申请首页 | 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 干法制粒机_智能干法制粒机_张家港市开创机械制造有限公司 | 全自动五线打端沾锡机,全自动裁线剥皮双头沾锡机,全自动尼龙扎带机-东莞市海文能机械设备有限公司 | 青海电动密集架_智能密集架_密集架价格-盛隆柜业青海档案密集架厂家 | 硬度计,金相磨抛机_厂家-莱州华煜众信试验仪器有限公司 | 飞利浦LED体育场灯具-吸顶式油站灯-飞利浦LED罩棚灯-佛山嘉耀照明有限公司 | 危废处理系统,水泥厂DCS集散控制系统,石灰窑设备自动化控制系统-淄博正展工控设备 | 网络推广公司_网络营销方案策划_企业网络推广外包平台-上海澜推网络 | 电池高低温试验箱-气态冲击箱-双层电池防爆箱|简户百科 | 哈尔滨治「失眠/抑郁/焦虑症/精神心理」专科医院排行榜-京科脑康免费咨询 一对一诊疗 | 全自动固相萃取仪_高通量真空平行浓缩仪-勤业永为 | T恤衫定做,企业文化衫制作订做,广告T恤POLO衫定制厂家[源头工厂]-【汉诚T恤定制网】 | 河北码上网络科技|邯郸小程序开发|邯郸微信开发|邯郸网站建设 | 衬氟旋塞阀-卡套旋塞阀-中升阀门首页 | 劳动法网-专业的劳动法和劳动争议仲裁服务网| 冷却塔风机厂家_静音冷却塔风机_冷却塔电机维修更换维修-广东特菱节能空调设备有限公司 |