掃一掃
關注中圖網
官方微博
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
數據挖掘與機器學習:基礎概念和算法(原書第2版) 版權信息
- ISBN:9787111726890
- 條形碼:9787111726890 ; 978-7-111-72689-0
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
數據挖掘與機器學習:基礎概念和算法(原書第2版) 內容簡介
本書詳實介紹了數據挖掘與機器學習相關的各種內容,包括數據矩陣、圖數據、核方法、項集挖掘、聚類、貝葉斯分類器、決策樹、支持向量機、線性回歸、邏輯回歸、神經網絡、深度學習等,介紹其相關概念和基礎算法,并在每章的末尾配有相關練習。第二版新增了幾個關于回歸的章節,包括神經網絡和深度學習的內容。
數據挖掘與機器學習:基礎概念和算法(原書第2版) 目錄
目 錄
Data Mining and Machine Learning
譯者序
前言
作者簡介
部分 數據分析基礎 1
第1章 數據矩陣 3
1.1 數據矩陣的組成 3
1.2 屬性 4
1.3 數據:代數和幾何觀點 5
1.3.1 距離和角度 7
1.3.2 均值和總方差 9
1.3.3 正交投影 10
1.3.4 線性無關和維數 12
1.4 數據:概率觀點 13
1.4.1 二元隨機變量 17
1.4.2 多元隨機變量 20
1.4.3 隨機抽樣與統計 21
1.5 拓展閱讀 22
1.6 練習 23
第2章 數值型屬性 24
2.1 一元分析 24
2.1.1 集中趨勢度量 25
2.1.2 離散度度量 28
2.2 二元分析 32
2.2.1 位置和離散度的度量 33
2.2.2 相關性度量 33
2.3 多元分析 37
2.4 數據歸一化 41
2.5 正態分布 42
2.5.1 一元正態分布 43
2.5.2 多元正態分布 44
2.6 拓展閱讀 47
2.7 練習 47
第3章 類別型屬性 49
3.1 一元分析 49
3.1.1 伯努利變量 49
3.1.2 多元伯努利變量 51
3.2 二元分析 56
3.3 多元分析 65
3.4 距離和角度 69
3.5 離散化 70
3.6 拓展閱讀 72
3.7 練習 72
第4章 圖數據 74
4.1 圖的概念 74
4.2 拓撲屬性 77
4.3 中心度分析 81
4.3.1 基本中心度 81
4.3.2 Web中心度 82
4.4 圖模型 89
4.4.1 Erd?s-Rényi隨機圖模型 91
4.4.2 Watts-Strogatz小世界圖
模型 94
4.4.3 Barabási-Albert無標度模型 98
4.5 拓展閱讀 104
4.6 練習 105
第5章 核方法 107
5.1 核矩陣 110
5.1.1 再生核映射 111
5.1.2 Mercer核映射 113
5.2 向量核 115
5.3 特征空間中的基本核運算 119
5.4 復雜對象的核 124
5.4.1 字符串的譜核 124
5.4.2 圖節點的擴散核 125
5.5 拓展閱讀 129
5.6 練習 129
第6章 高維數據 130
6.1 高維對象 130
6.2 高維體積 133
6.3 超立方體的內接超球面 135
6.4 薄超球面殼的體積 136
6.5 超空間的對角線 137
6.6 多元正態分布的密度 138
6.7 附錄:超球面體積的推導 140
6.8 拓展閱讀 143
6.9 練習 144
第7章 降維 146
7.1 背景介紹 146
7.2 主成分分析 149
7.2.1 一維近似 149
7.2.2 二維近似 152
7.2.3 r維近似 155
7.2.4 主成分分析的幾何意義 158
7.3 核主成分分析 160
7.4 奇異值分解 166
7.4.1 奇異值分解中的幾何
意義 167
7.4.2 SVD和PCA之間的
聯系 168
7.5 拓展閱讀 169
7.6 練習 169
第二部分 頻繁模式挖掘 171
第8章 項集挖掘 173
8.1 頻繁項集和關聯規則 173
8.2 項集挖掘算法 176
8.2.1 逐層方法:Apriori算法 177
8.2.2 事務標識符集的交集方法:
Eclat算法 181
8.2.3 頻繁模式樹方法:FPGrowth
算法 184
8.3 生成關聯規則 188
8.4 拓展閱讀 189
8.5 練習 190
第9章 項集概覽 194
9.1 頻繁項集和閉頻繁項集 194
9.2 挖掘頻繁項集:GenMax
算法 196
9.3 挖掘閉頻繁項集:Charm算法 198
9.4 非可導項集 200
9.5 拓展閱讀 205
9.6 練習 205
第10章 序列挖掘 208
10.1 頻繁序列 208
10.2 挖掘頻繁序列 209
10.2.1 逐層挖掘:GSP 209
10.2.2 垂直序列挖掘:Spade 211
10.2.3 基于投影的序列挖掘:
PrefixSpan 212
10.3 基于后綴樹的子串挖掘 214
10.3.1 后綴樹 214
10.3.2 Ukkonen線性時間復雜度
算法 217
10.4 拓展閱讀 222
10.5 練習 223
第11章 圖模式挖掘 226
11.1 同構與支持度 226
11.2 候選圖生成 229
11.3 gSpan算法 232
11.3.1 擴展和支持度計算 233
11.3.2 權威性檢測 238
11.4 拓展閱讀 239
11.5 練習 239
第12章 模式評估與規則評估 242
12.1 模式評估和規則評估的度量 242
12.1.1 規則評估度量 242
12.1.2 模式評估度量 249
12.1.3 比較多條規則和模式 251
12.2 顯著性檢驗和置信區間 253
12.2.1 產生式規則的費希爾
精確檢驗 254
12.2.2 顯著性的置換檢驗 257
12.2.3 置信區間內的自助抽樣 261
12.3 拓展閱讀 262
12.4 練習 263
第三部分 聚類 265
第13章 基于代表點的聚類 267
13.1 K-means算法 267
13.2 核K-means 271
13.3 期望化聚類 274
1
Data Mining and Machine Learning
譯者序
前言
作者簡介
部分 數據分析基礎 1
第1章 數據矩陣 3
1.1 數據矩陣的組成 3
1.2 屬性 4
1.3 數據:代數和幾何觀點 5
1.3.1 距離和角度 7
1.3.2 均值和總方差 9
1.3.3 正交投影 10
1.3.4 線性無關和維數 12
1.4 數據:概率觀點 13
1.4.1 二元隨機變量 17
1.4.2 多元隨機變量 20
1.4.3 隨機抽樣與統計 21
1.5 拓展閱讀 22
1.6 練習 23
第2章 數值型屬性 24
2.1 一元分析 24
2.1.1 集中趨勢度量 25
2.1.2 離散度度量 28
2.2 二元分析 32
2.2.1 位置和離散度的度量 33
2.2.2 相關性度量 33
2.3 多元分析 37
2.4 數據歸一化 41
2.5 正態分布 42
2.5.1 一元正態分布 43
2.5.2 多元正態分布 44
2.6 拓展閱讀 47
2.7 練習 47
第3章 類別型屬性 49
3.1 一元分析 49
3.1.1 伯努利變量 49
3.1.2 多元伯努利變量 51
3.2 二元分析 56
3.3 多元分析 65
3.4 距離和角度 69
3.5 離散化 70
3.6 拓展閱讀 72
3.7 練習 72
第4章 圖數據 74
4.1 圖的概念 74
4.2 拓撲屬性 77
4.3 中心度分析 81
4.3.1 基本中心度 81
4.3.2 Web中心度 82
4.4 圖模型 89
4.4.1 Erd?s-Rényi隨機圖模型 91
4.4.2 Watts-Strogatz小世界圖
模型 94
4.4.3 Barabási-Albert無標度模型 98
4.5 拓展閱讀 104
4.6 練習 105
第5章 核方法 107
5.1 核矩陣 110
5.1.1 再生核映射 111
5.1.2 Mercer核映射 113
5.2 向量核 115
5.3 特征空間中的基本核運算 119
5.4 復雜對象的核 124
5.4.1 字符串的譜核 124
5.4.2 圖節點的擴散核 125
5.5 拓展閱讀 129
5.6 練習 129
第6章 高維數據 130
6.1 高維對象 130
6.2 高維體積 133
6.3 超立方體的內接超球面 135
6.4 薄超球面殼的體積 136
6.5 超空間的對角線 137
6.6 多元正態分布的密度 138
6.7 附錄:超球面體積的推導 140
6.8 拓展閱讀 143
6.9 練習 144
第7章 降維 146
7.1 背景介紹 146
7.2 主成分分析 149
7.2.1 一維近似 149
7.2.2 二維近似 152
7.2.3 r維近似 155
7.2.4 主成分分析的幾何意義 158
7.3 核主成分分析 160
7.4 奇異值分解 166
7.4.1 奇異值分解中的幾何
意義 167
7.4.2 SVD和PCA之間的
聯系 168
7.5 拓展閱讀 169
7.6 練習 169
第二部分 頻繁模式挖掘 171
第8章 項集挖掘 173
8.1 頻繁項集和關聯規則 173
8.2 項集挖掘算法 176
8.2.1 逐層方法:Apriori算法 177
8.2.2 事務標識符集的交集方法:
Eclat算法 181
8.2.3 頻繁模式樹方法:FPGrowth
算法 184
8.3 生成關聯規則 188
8.4 拓展閱讀 189
8.5 練習 190
第9章 項集概覽 194
9.1 頻繁項集和閉頻繁項集 194
9.2 挖掘頻繁項集:GenMax
算法 196
9.3 挖掘閉頻繁項集:Charm算法 198
9.4 非可導項集 200
9.5 拓展閱讀 205
9.6 練習 205
第10章 序列挖掘 208
10.1 頻繁序列 208
10.2 挖掘頻繁序列 209
10.2.1 逐層挖掘:GSP 209
10.2.2 垂直序列挖掘:Spade 211
10.2.3 基于投影的序列挖掘:
PrefixSpan 212
10.3 基于后綴樹的子串挖掘 214
10.3.1 后綴樹 214
10.3.2 Ukkonen線性時間復雜度
算法 217
10.4 拓展閱讀 222
10.5 練習 223
第11章 圖模式挖掘 226
11.1 同構與支持度 226
11.2 候選圖生成 229
11.3 gSpan算法 232
11.3.1 擴展和支持度計算 233
11.3.2 權威性檢測 238
11.4 拓展閱讀 239
11.5 練習 239
第12章 模式評估與規則評估 242
12.1 模式評估和規則評估的度量 242
12.1.1 規則評估度量 242
12.1.2 模式評估度量 249
12.1.3 比較多條規則和模式 251
12.2 顯著性檢驗和置信區間 253
12.2.1 產生式規則的費希爾
精確檢驗 254
12.2.2 顯著性的置換檢驗 257
12.2.3 置信區間內的自助抽樣 261
12.3 拓展閱讀 262
12.4 練習 263
第三部分 聚類 265
第13章 基于代表點的聚類 267
13.1 K-means算法 267
13.2 核K-means 271
13.3 期望化聚類 274
1
展開全部
書友推薦
- >
名家帶你讀魯迅:故事新編
- >
小考拉的故事-套裝共3冊
- >
巴金-再思錄
- >
伯納黛特,你要去哪(2021新版)
- >
二體千字文
- >
龍榆生:詞曲概論/大家小書
- >
企鵝口袋書系列·偉大的思想20:論自然選擇(英漢雙語)
- >
朝聞道
本類暢銷