中圖網(wǎng)小程序
一鍵登錄
更方便
>
>
數(shù)據(jù)科學(xué)與工程技術(shù)叢書機(jī)器學(xué)習(xí)基礎(chǔ):面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究
包郵 數(shù)據(jù)科學(xué)與工程技術(shù)叢書機(jī)器學(xué)習(xí)基礎(chǔ):面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究
開本:
16開
頁數(shù):
368
本類五星書更多>
-
>
全國計算機(jī)等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應(yīng)用
-
>
決戰(zhàn)行測5000題(言語理解與表達(dá))
-
>
軟件性能測試.分析與調(diào)優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強(qiáng)教科書(完全版)(全彩印刷)
-
>
深度學(xué)習(xí)
數(shù)據(jù)科學(xué)與工程技術(shù)叢書機(jī)器學(xué)習(xí)基礎(chǔ):面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究 版權(quán)信息
- ISBN:9787111652335
- 條形碼:9787111652335 ; 978-7-111-65233-5
- 裝幀:平裝-膠訂
- 冊數(shù):暫無
- 重量:暫無
- 所屬分類:>
數(shù)據(jù)科學(xué)與工程技術(shù)叢書機(jī)器學(xué)習(xí)基礎(chǔ):面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究 本書特色
本書重點講述用于預(yù)測性數(shù)據(jù)分析的*重要的機(jī)器學(xué)習(xí)方法,包括理論概念和實際應(yīng)用。
數(shù)據(jù)科學(xué)與工程技術(shù)叢書機(jī)器學(xué)習(xí)基礎(chǔ):面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究 內(nèi)容簡介
本書重點講述用于預(yù)測性數(shù)據(jù)分析的*重要的機(jī)器學(xué)習(xí)方法,包括理論概念和實際應(yīng)用。
數(shù)據(jù)科學(xué)與工程技術(shù)叢書機(jī)器學(xué)習(xí)基礎(chǔ):面向預(yù)測數(shù)據(jù)分析的算法、實用范例與案例研究 目錄
譯者序
前言
符號記法
第1章 面向預(yù)測數(shù)據(jù)分析的機(jī)器學(xué)習(xí) 1
1.1 什么是預(yù)測數(shù)據(jù)分析 1
1.2 什么是機(jī)器學(xué)習(xí) 2
1.3 機(jī)器學(xué)習(xí)的工作原理 4
1.4 機(jī)器學(xué)習(xí)會產(chǎn)生什么問題 7
1.5 預(yù)測數(shù)據(jù)分析項目的生命周期:CRISP-DM 9
1.6 預(yù)測數(shù)據(jù)分析工具 10
1.7 本書概覽 11
1.8 習(xí)題 12
第2章 數(shù)據(jù)到見解再到?jīng)Q策 13
2.1 將商業(yè)問題轉(zhuǎn)化為分析解決方案 13
2.2 可行性評估 14
2.3 設(shè)計分析基礎(chǔ)表 16
2.4 特征的設(shè)計與實現(xiàn) 19
2.4.1 不同的數(shù)據(jù)類型 20
2.4.2 不同的特征類型 20
2.4.3 處理時間 21
2.4.4 法律問題 23
2.4.5 特征的實現(xiàn) 25
2.4.6 案例研究:汽車保險詐騙 25
2.5 總結(jié) 28
2.6 延伸閱讀 28
2.7 習(xí)題 29
第3章 數(shù)據(jù)探索 31
3.1 數(shù)據(jù)質(zhì)量報告 31
3.2 了解數(shù)據(jù) 35
3.2.1 正態(tài)分布 37
3.2.2 案例研究:汽車保險詐騙 38
3.3 找出數(shù)據(jù)質(zhì)量問題 39
3.3.1 缺失值 39
3.3.2 異常基數(shù) 40
3.3.3 離群點 40
3.3.4 案例研究:汽車保險詐騙 41
3.4 處理數(shù)據(jù)質(zhì)量問題 42
3.4.1 處理缺失值 43
3.4.2 處理離群點 43
3.4.3 案例研究:汽車保險詐騙 44
3.5 高階數(shù)據(jù)探索 45
3.5.1 可視化特征之間的關(guān)系 45
3.5.2 度量協(xié)方差和相關(guān)性 52
3.6 數(shù)據(jù)準(zhǔn)備 56
3.6.1 歸一化 56
3.6.2 分箱 57
3.6.3 采樣 60
3.7 總結(jié) 61
3.8 延伸閱讀 62
3.9 習(xí)題 62
第4章 基于信息的學(xué)習(xí) 73
4.1 大思路 73
4.2 基礎(chǔ)知識 75
4.2.1 決策樹 75
4.2.2 香農(nóng)熵模型 77
4.2.3 信息增益 80
4.3 標(biāo)準(zhǔn)方法:ID3算法 83
4.4 延伸與拓展 89
4.4.1 其他特征選取與純度度量方法 89
4.4.2 處理連續(xù)描述性特征 92
4.4.3 預(yù)測連續(xù)目標(biāo) 95
4.4.4 剪枝 98
4.4.5 模型組合 100
4.5 總結(jié) 103
4.6 延伸閱讀 104
4.7 習(xí)題 104
第5章 基于相似性的學(xué)習(xí) 109
5.1 大思路 109
5.2 基本概念 110
5.2.1 特征空間 110
5.2.2 用距離度量測量相似性 111
5.3 標(biāo)準(zhǔn)方法:*近鄰算法 113
5.4 延伸與拓展 116
5.4.1 處理嘈雜數(shù)據(jù) 116
5.4.2 高效內(nèi)存搜索 118
5.4.3 數(shù)據(jù)歸一化 124
5.4.4 預(yù)測連續(xù)目標(biāo) 127
5.4.5 其他相似性測量 129
5.4.6 特征選取 136
5.5 總結(jié) 141
5.6 延伸閱讀 143
5.7 后記 144
5.8 習(xí)題 144
第6章 基于概率的學(xué)習(xí) 149
6.1 大思路 149
6.2 基礎(chǔ)知識 151
6.2.1 貝葉斯定理 152
6.2.2 貝葉斯預(yù)測 154
6.2.3 條件獨(dú)立與因子化 157
6.3 標(biāo)準(zhǔn)方法:樸素貝葉斯模型 160
6.4 延伸與拓展 163
6.4.1 平滑 163
6.4.2 連續(xù)特征:概率密度函數(shù) 166
6.4.3 連續(xù)特征:分箱 174
6.4.4 貝葉斯網(wǎng)絡(luò) 177
6.5 總結(jié) 187
6.6 延伸閱讀 188
6.7 習(xí)題 188
第7章 基于誤差的學(xué)習(xí) 192
7.1 大思路 192
7.2 基礎(chǔ)知識 192
7.2.1 簡單線性回歸 193
7.2.2 測量誤差 194
7.2.3 誤差曲面 196
7.3 標(biāo)準(zhǔn)方法:使用梯度下降法的多變量線性回歸 197
7.3.1 多變量線性回歸 198
7.3.2 梯度下降法 198
7.3.3 選擇學(xué)習(xí)率和初始權(quán)值 203
7.3.4 實用范例 204
7.4 延伸與拓展 206
7.4.1 解釋多變量線性回歸模型 206
7.4.2 用權(quán)值衰減設(shè)定學(xué)習(xí)率 208
7.4.3 處理類別描述性特征 209
7.4.4 處理類別目標(biāo)特征:對數(shù)幾率回歸 210
7.4.5 建模非線性關(guān)系 219
7.4.6 多項對數(shù)幾率回歸 223
7.4.7 支持向量機(jī) 226
7.5 總結(jié) 229
7.6 延伸閱讀 231
7.7 習(xí)題 231
第8章 評估 237
8.1 大思路 237
8.2 基礎(chǔ)知識 238
8.3 標(biāo)準(zhǔn)方法:留出測試集上的誤分類率 238
8.4 延伸與拓展 241
8.4.1 設(shè)計評估實驗 241
8.4.2 性能度量:類別目標(biāo) 246
8.4.3 性能度量:預(yù)測得分 252
8.4.4 性能度量:多項目標(biāo) 264
8.4.5 性能度量:連續(xù)目標(biāo) 265
8.4.6 評估部署后的模型 268
8.5 總結(jié) 273
8.6 延伸閱讀 273
8.7 習(xí)題 274
第9章 案例研究:客戶流失 278
9.1 商業(yè)理解 278
9.2 數(shù)據(jù)理解 280
9.3 數(shù)據(jù)準(zhǔn)備 283
9.4 建模 286
9.5 評估 289
9.6 部署 290
第10章 案例研究:星系分類 292
10.1 商業(yè)理解 292
10.2 數(shù)據(jù)理解 294
10.3 數(shù)據(jù)準(zhǔn)備 299
10.4 建模 303
10.4.1 基準(zhǔn)模型 303
10.4.2 特征選取 305
10.4.3 5級別模型 306
10.5 評估 307
10.6 部署 308
第11章 面向預(yù)測數(shù)據(jù)分析的機(jī)器學(xué)習(xí)藝術(shù) 309
11.1 預(yù)測模型的不同視角 310
11.2 選擇機(jī)器學(xué)習(xí)方法 313
11.2.1 將機(jī)器學(xué)習(xí)方法和項目匹配 315
11.2.2 將機(jī)器學(xué)習(xí)方法和數(shù)據(jù)匹配 315
11.3 總結(jié) 316
附錄A 機(jī)器學(xué)習(xí)的描述性統(tǒng)計量與數(shù)據(jù)可視化 317
附錄B 機(jī)器學(xué)習(xí)的概率論導(dǎo)論 326
附錄C 機(jī)器學(xué)習(xí)中的求導(dǎo)方法 332
參考文獻(xiàn) 336
索引 343
前言
符號記法
第1章 面向預(yù)測數(shù)據(jù)分析的機(jī)器學(xué)習(xí) 1
1.1 什么是預(yù)測數(shù)據(jù)分析 1
1.2 什么是機(jī)器學(xué)習(xí) 2
1.3 機(jī)器學(xué)習(xí)的工作原理 4
1.4 機(jī)器學(xué)習(xí)會產(chǎn)生什么問題 7
1.5 預(yù)測數(shù)據(jù)分析項目的生命周期:CRISP-DM 9
1.6 預(yù)測數(shù)據(jù)分析工具 10
1.7 本書概覽 11
1.8 習(xí)題 12
第2章 數(shù)據(jù)到見解再到?jīng)Q策 13
2.1 將商業(yè)問題轉(zhuǎn)化為分析解決方案 13
2.2 可行性評估 14
2.3 設(shè)計分析基礎(chǔ)表 16
2.4 特征的設(shè)計與實現(xiàn) 19
2.4.1 不同的數(shù)據(jù)類型 20
2.4.2 不同的特征類型 20
2.4.3 處理時間 21
2.4.4 法律問題 23
2.4.5 特征的實現(xiàn) 25
2.4.6 案例研究:汽車保險詐騙 25
2.5 總結(jié) 28
2.6 延伸閱讀 28
2.7 習(xí)題 29
第3章 數(shù)據(jù)探索 31
3.1 數(shù)據(jù)質(zhì)量報告 31
3.2 了解數(shù)據(jù) 35
3.2.1 正態(tài)分布 37
3.2.2 案例研究:汽車保險詐騙 38
3.3 找出數(shù)據(jù)質(zhì)量問題 39
3.3.1 缺失值 39
3.3.2 異常基數(shù) 40
3.3.3 離群點 40
3.3.4 案例研究:汽車保險詐騙 41
3.4 處理數(shù)據(jù)質(zhì)量問題 42
3.4.1 處理缺失值 43
3.4.2 處理離群點 43
3.4.3 案例研究:汽車保險詐騙 44
3.5 高階數(shù)據(jù)探索 45
3.5.1 可視化特征之間的關(guān)系 45
3.5.2 度量協(xié)方差和相關(guān)性 52
3.6 數(shù)據(jù)準(zhǔn)備 56
3.6.1 歸一化 56
3.6.2 分箱 57
3.6.3 采樣 60
3.7 總結(jié) 61
3.8 延伸閱讀 62
3.9 習(xí)題 62
第4章 基于信息的學(xué)習(xí) 73
4.1 大思路 73
4.2 基礎(chǔ)知識 75
4.2.1 決策樹 75
4.2.2 香農(nóng)熵模型 77
4.2.3 信息增益 80
4.3 標(biāo)準(zhǔn)方法:ID3算法 83
4.4 延伸與拓展 89
4.4.1 其他特征選取與純度度量方法 89
4.4.2 處理連續(xù)描述性特征 92
4.4.3 預(yù)測連續(xù)目標(biāo) 95
4.4.4 剪枝 98
4.4.5 模型組合 100
4.5 總結(jié) 103
4.6 延伸閱讀 104
4.7 習(xí)題 104
第5章 基于相似性的學(xué)習(xí) 109
5.1 大思路 109
5.2 基本概念 110
5.2.1 特征空間 110
5.2.2 用距離度量測量相似性 111
5.3 標(biāo)準(zhǔn)方法:*近鄰算法 113
5.4 延伸與拓展 116
5.4.1 處理嘈雜數(shù)據(jù) 116
5.4.2 高效內(nèi)存搜索 118
5.4.3 數(shù)據(jù)歸一化 124
5.4.4 預(yù)測連續(xù)目標(biāo) 127
5.4.5 其他相似性測量 129
5.4.6 特征選取 136
5.5 總結(jié) 141
5.6 延伸閱讀 143
5.7 后記 144
5.8 習(xí)題 144
第6章 基于概率的學(xué)習(xí) 149
6.1 大思路 149
6.2 基礎(chǔ)知識 151
6.2.1 貝葉斯定理 152
6.2.2 貝葉斯預(yù)測 154
6.2.3 條件獨(dú)立與因子化 157
6.3 標(biāo)準(zhǔn)方法:樸素貝葉斯模型 160
6.4 延伸與拓展 163
6.4.1 平滑 163
6.4.2 連續(xù)特征:概率密度函數(shù) 166
6.4.3 連續(xù)特征:分箱 174
6.4.4 貝葉斯網(wǎng)絡(luò) 177
6.5 總結(jié) 187
6.6 延伸閱讀 188
6.7 習(xí)題 188
第7章 基于誤差的學(xué)習(xí) 192
7.1 大思路 192
7.2 基礎(chǔ)知識 192
7.2.1 簡單線性回歸 193
7.2.2 測量誤差 194
7.2.3 誤差曲面 196
7.3 標(biāo)準(zhǔn)方法:使用梯度下降法的多變量線性回歸 197
7.3.1 多變量線性回歸 198
7.3.2 梯度下降法 198
7.3.3 選擇學(xué)習(xí)率和初始權(quán)值 203
7.3.4 實用范例 204
7.4 延伸與拓展 206
7.4.1 解釋多變量線性回歸模型 206
7.4.2 用權(quán)值衰減設(shè)定學(xué)習(xí)率 208
7.4.3 處理類別描述性特征 209
7.4.4 處理類別目標(biāo)特征:對數(shù)幾率回歸 210
7.4.5 建模非線性關(guān)系 219
7.4.6 多項對數(shù)幾率回歸 223
7.4.7 支持向量機(jī) 226
7.5 總結(jié) 229
7.6 延伸閱讀 231
7.7 習(xí)題 231
第8章 評估 237
8.1 大思路 237
8.2 基礎(chǔ)知識 238
8.3 標(biāo)準(zhǔn)方法:留出測試集上的誤分類率 238
8.4 延伸與拓展 241
8.4.1 設(shè)計評估實驗 241
8.4.2 性能度量:類別目標(biāo) 246
8.4.3 性能度量:預(yù)測得分 252
8.4.4 性能度量:多項目標(biāo) 264
8.4.5 性能度量:連續(xù)目標(biāo) 265
8.4.6 評估部署后的模型 268
8.5 總結(jié) 273
8.6 延伸閱讀 273
8.7 習(xí)題 274
第9章 案例研究:客戶流失 278
9.1 商業(yè)理解 278
9.2 數(shù)據(jù)理解 280
9.3 數(shù)據(jù)準(zhǔn)備 283
9.4 建模 286
9.5 評估 289
9.6 部署 290
第10章 案例研究:星系分類 292
10.1 商業(yè)理解 292
10.2 數(shù)據(jù)理解 294
10.3 數(shù)據(jù)準(zhǔn)備 299
10.4 建模 303
10.4.1 基準(zhǔn)模型 303
10.4.2 特征選取 305
10.4.3 5級別模型 306
10.5 評估 307
10.6 部署 308
第11章 面向預(yù)測數(shù)據(jù)分析的機(jī)器學(xué)習(xí)藝術(shù) 309
11.1 預(yù)測模型的不同視角 310
11.2 選擇機(jī)器學(xué)習(xí)方法 313
11.2.1 將機(jī)器學(xué)習(xí)方法和項目匹配 315
11.2.2 將機(jī)器學(xué)習(xí)方法和數(shù)據(jù)匹配 315
11.3 總結(jié) 316
附錄A 機(jī)器學(xué)習(xí)的描述性統(tǒng)計量與數(shù)據(jù)可視化 317
附錄B 機(jī)器學(xué)習(xí)的概率論導(dǎo)論 326
附錄C 機(jī)器學(xué)習(xí)中的求導(dǎo)方法 332
參考文獻(xiàn) 336
索引 343
展開全部
書友推薦
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
回憶愛瑪儂
- >
經(jīng)典常談
- >
月亮虎
- >
莉莉和章魚
- >
煙與鏡
- >
朝聞道
- >
伯納黛特,你要去哪(2021新版)
本類暢銷