-
>
闖進(jìn)數(shù)學(xué)世界――探秘歷史名題
-
>
中醫(yī)基礎(chǔ)理論
-
>
當(dāng)代中國(guó)政府與政治(新編21世紀(jì)公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國(guó)特色社會(huì)主義理論體系概論(2021年版)
-
>
中醫(yī)內(nèi)科學(xué)·全國(guó)中醫(yī)藥行業(yè)高等教育“十四五”規(guī)劃教材
機(jī)器學(xué)習(xí)導(dǎo)論與實(shí)踐 版權(quán)信息
- ISBN:9787302649281
- 條形碼:9787302649281 ; 978-7-302-64928-1
- 裝幀:平裝-膠訂
- 冊(cè)數(shù):暫無
- 重量:暫無
- 所屬分類:>
機(jī)器學(xué)習(xí)導(dǎo)論與實(shí)踐 本書特色
本書將機(jī)器學(xué)習(xí)的理論知識(shí)與實(shí)踐相結(jié)合。 機(jī)器學(xué)習(xí)是人工智能研究領(lǐng)域中一個(gè)極其重要的方向。由于移動(dòng)互聯(lián)網(wǎng)、電子商務(wù)以及社交媒體的快速發(fā)展使數(shù)據(jù)急劇增長(zhǎng),本書將從Spark基礎(chǔ)知識(shí)入手,基于案例詳細(xì)講解Spark的使用及在機(jī)器學(xué)習(xí)上的應(yīng)用,適用于高校數(shù)據(jù)科學(xué)及大數(shù)據(jù)技術(shù)相關(guān)專業(yè)課程教材和面向各專業(yè)的數(shù)據(jù)科學(xué)通用教材,也可提供廣大IT從業(yè)人員參考。
機(jī)器學(xué)習(xí)導(dǎo)論與實(shí)踐 內(nèi)容簡(jiǎn)介
本書詳細(xì)介紹機(jī)器學(xué)習(xí)主要算法,包括:C4.5決策樹、k-均值(K-means)、支持向量機(jī)(SVM)、Apriori、*大期望值、PageRank算法、AdaBoost算法、k-近鄰算法(kNN)、樸素貝葉斯算法和分類回歸樹算法以及神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的簡(jiǎn)單介紹。
機(jī)器學(xué)習(xí)導(dǎo)論與實(shí)踐 目錄
1.1 機(jī)器學(xué)習(xí)的定義 1
1.2 基本術(shù)語(yǔ) 2
1.3 模型評(píng)估與選擇 3
1.3.1 經(jīng)驗(yàn)誤差與過擬合 3
1.3.2 評(píng)估方法 3
1.4 機(jī)器學(xué)習(xí)解決問題的基本思路 4
1.5 Python語(yǔ)言 5
1.5.1 Python簡(jiǎn)介 5
1.5.2 Python基礎(chǔ)語(yǔ)法 5
1.5.3 NumPy 快速入門 12
1.5.4 Matplotlib 快速入門 16
1.6 習(xí)題 19
第2章 線性模型 21
2.1 基本形式 21
2.2 線性回歸 21
2.3 邏輯回歸 23
2.3.1 Logistic分布 24
2.3.2 邏輯回歸與Sigmoid函數(shù) 24
2.3.3 基于*優(yōu)化方法確定*佳回歸系數(shù) 26
2.4 應(yīng)用實(shí)例 27
2.4.1 線性回歸——波士頓房?jī)r(jià)預(yù)測(cè) 27
2.4.2 邏輯回歸——從疝氣病癥預(yù)測(cè)病馬的死亡率 30
2.5 習(xí)題 33
第3章 樸素貝葉斯 35
3.1 樸素貝葉斯相關(guān)統(tǒng)計(jì)學(xué)知識(shí) 35
3.2 樸素貝葉斯法的學(xué)習(xí)與分類 37
3.2.1 基本方法 37
3.2.2 后驗(yàn)概率*大化的含義 38
3.2.3 樸素貝葉斯分類基本流程 39
3.3 極大似然估計(jì) 41
3.4 應(yīng)用實(shí)例——PC評(píng)論分類 44
3.5 習(xí)題 48
第4章 k-近鄰算法 51
4.1 k-近鄰算法概述 51
4.2 kNN算法主要步驟 52
4.2.1 距離度量 52
4.2.2 k值的選擇 52
4.2.3 分類決策 53
4.3 應(yīng)用實(shí)例——鳶尾花分類 54
4.3.1 項(xiàng)目背景 54
4.3.2 讀取數(shù)據(jù)與數(shù)據(jù)可視化 54
4.3.3 劃分?jǐn)?shù)據(jù)集 56
4.3.4 kNN算法 56
4.3.5 如何測(cè)試分類器 57
4.4 習(xí)題 58
第5章 決策樹 59
5.1 決策樹的基本概念 60
5.1.1 定義 60
5.1.2 決策樹的構(gòu)造 60
5.2 決策樹學(xué)習(xí)基礎(chǔ)算法 60
5.3 *優(yōu)屬性的選擇 61
5.3.1 ID3——信息增益(Gain) 61
5.3.2 C4.5——信息增益率(Gain_ratio) 62
5.3.3 CART——基尼指數(shù)(Gini_index) 63
5.4 決策樹的剪枝 63
5.5 應(yīng)用實(shí)例——性別決策 64
5.6 Python實(shí)現(xiàn)過程 65
5.6.1 計(jì)算給定數(shù)據(jù)集的信息熵 65
5.6.2 數(shù)據(jù)集的劃分 66
5.6.3 遞歸構(gòu)建決策樹 67
5.7 使用Matplotlib繪制決策樹 69
5.7.1 Matplotlib注解 69
5.7.2 繪制決策樹 69
5.8 習(xí)題 72
第6章 支持向量機(jī) 74
6.1 基于*大間隔分隔數(shù)據(jù) 74
6.2 尋找*大間隔 76
6.2.1 拉格朗日對(duì)偶性 78
6.2.2 SMO算法 82
6.3 軟間隔*大化 83
6.4 核函數(shù) 85
6.5 徑向基函數(shù) 88
6.6 應(yīng)用實(shí)例 88
6.7 習(xí)題 95
第7章 神經(jīng)網(wǎng)絡(luò) 97
7.1 神經(jīng)元模型 97
7.2 感知機(jī)與多層前饋神經(jīng)網(wǎng)絡(luò) 100
7.2.1 感知機(jī) 100
7.2.2 多層前饋神經(jīng)網(wǎng)絡(luò) 102
7.3 BP神經(jīng)網(wǎng)絡(luò) 103
7.4 其他常見神經(jīng)網(wǎng)絡(luò) 106
7.4.1 RBF網(wǎng)絡(luò) 106
7.4.2 ART網(wǎng)絡(luò) 106
7.4.3 SOM網(wǎng)絡(luò) 107
7.4.4 級(jí)聯(lián)相關(guān)網(wǎng)絡(luò) 107
7.4.5 Elman網(wǎng)絡(luò) 108
7.5 應(yīng)用實(shí)例——從疝氣病癥預(yù)測(cè)病馬的死亡率 109
7.5.1 處理數(shù)據(jù)中的缺失值 109
7.5.2 用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè) 110
7.6 習(xí)題 113
第8章 深度學(xué)習(xí) 115
8.1 卷積神經(jīng)網(wǎng)絡(luò) 116
8.2 典型的卷積神經(jīng)網(wǎng)絡(luò) 119
8.2.1 LeNet 119
8.2.2 AlexNet 120
8.2.3 VGGNet 120
8.2.4 ResNet 121
8.3 循環(huán)神經(jīng)網(wǎng)絡(luò) 123
8.4 深度學(xué)習(xí)框架 125
8.4.1 深度學(xué)習(xí)框架的作用 125
8.4.2 常見的深度學(xué)習(xí)框架 125
8.4.3 飛槳概述——深度學(xué)習(xí)開源平臺(tái)PaddlePaddle 126
8.5 線性回歸小實(shí)例在飛槳深度學(xué)習(xí)平臺(tái)的應(yīng)用 129
8.6 深度學(xué)習(xí)應(yīng)用實(shí)例——口罩識(shí)別 139
8.7 習(xí)題 156
第9章 集成學(xué)習(xí)方法 157
9.1 集成學(xué)習(xí)的分類 157
9.2 Bagging和隨機(jī)森林 158
9.2.1 Bagging并行集成學(xué)習(xí) 158
9.2.2 隨機(jī)森林 160
9.3 Boosting集成學(xué)習(xí)方法 161
9.4 基于AdaBoost的分類 162
9.5 基于XGBoost的分類 164
9.5.1 GBDT 164
9.5.2 XGBoost 166
9.6 應(yīng)用實(shí)例 168
9.6.1 基于AdaBoost算法 168
9.6.2 基于XGBoost算法 172
9.7 習(xí)題 175
第10章 K-均值聚類 177
10.1 K-均值聚類算法 177
10.1.1 模型 178
10.1.2 算法 178
10.1.3 算法特性 180
10.2 二分K-均值算法 180
10.2.1 使用后處理來提高聚類性能 180
10.2.2 二分K-均值聚類算法 181
10.3 應(yīng)用實(shí)例 182
10.4 習(xí)題 187
第11章 Apriori算法及關(guān)聯(lián)分析 189
11.1 關(guān)聯(lián)分析 190
11.1.1 頻繁項(xiàng)集的評(píng)估標(biāo)準(zhǔn) 190
11.1.2 關(guān)聯(lián)分析算法過程 191
11.2 Apriori算法基本原理 192
11.3 使用Apriori算法來發(fā)現(xiàn)頻繁項(xiàng)集 193
11.4 從頻繁項(xiàng)集中挖掘關(guān)聯(lián)規(guī)則 195
11.5 應(yīng)用實(shí)例 196
11.6 習(xí)題 200
第12章 FP-growth算法及頻繁項(xiàng)集的挖掘 201
12.1 FP樹介紹 202
12.2 構(gòu)造FP樹 203
12.2.1 頭指針表的建立 204
12.2.2 FP樹的建立 204
12.3 從FP樹中挖掘頻繁項(xiàng)集 207
12.3.1 抽取條件模式基 208
12.3.2 FP算法歸納 210
12.4 應(yīng)用實(shí)例 211
12.5 習(xí)題 215
第13章 PCA及數(shù)據(jù)降維 216
13.1 降維技術(shù) 216
13.2 PCA技術(shù) 217
13.2.1 PCA的推導(dǎo):基于*小投影距離 219
13.2.2 PCA的推導(dǎo):基于*大投影方差 220
13.2.3 PCA算法流程 221
13.3 應(yīng)用實(shí)例 222
13.4 習(xí)題 225
第14章 奇異值分解及應(yīng)用 226
14.1 奇異值分解的應(yīng)用 226
14.1.1 隱形語(yǔ)義索引 226
14.1.2 推薦系統(tǒng) 227
14.2 奇異值分解原理 227
14.2.1 特征值與特征向量的回顧 228
14.2.2 奇異值分解的定義 228
14.2.3 緊奇異值分解與截?cái)嗥娈愔捣纸? 230
14.3 應(yīng)用實(shí)例 232
14.3.1 觀影數(shù)據(jù)的生成 232
14.3.2 基于協(xié)同過濾的推薦引擎 233
14.3.3 基于物品的相似度和基于用戶的相似度 234
14.3.4 示例:電影推薦引擎 234
14.4 習(xí)題 237
第15章 綜合實(shí)例 238
15.1 綜合實(shí)例一 238
15.2 綜合實(shí)例二 251
15.3 綜合實(shí)例三 266
15.4 綜合實(shí)例四 282
參考文獻(xiàn) 288
機(jī)器學(xué)習(xí)導(dǎo)論與實(shí)踐 作者簡(jiǎn)介
饒泓,女,1973年生,博士,南昌大學(xué)教授,現(xiàn)任南昌大學(xué)信息工程學(xué)院副院長(zhǎng),博士生導(dǎo)師。曾先后赴美國(guó)伊利諾伊州立大學(xué)、美國(guó)堪薩斯大學(xué)訪學(xué)。主要研究方向?yàn)闄C(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、大數(shù)據(jù)處理算法及其應(yīng)用。近年來致力于機(jī)器學(xué)習(xí)領(lǐng)域的多分類模型研究,并將機(jī)器學(xué)習(xí)理論應(yīng)用于特種設(shè)備監(jiān)測(cè)、大型橋梁健康監(jiān)測(cè)及預(yù)測(cè),網(wǎng)絡(luò)廣告的精準(zhǔn)推薦、輿情監(jiān)測(cè)與預(yù)測(cè)、自然語(yǔ)言理解等領(lǐng)域。
- >
大紅狗在馬戲團(tuán)-大紅狗克里弗-助人
- >
名家?guī)阕x魯迅:故事新編
- >
龍榆生:詞曲概論/大家小書
- >
中國(guó)人在烏蘇里邊疆區(qū):歷史與人類學(xué)概述
- >
上帝之肋:男人的真實(shí)旅程
- >
經(jīng)典常談
- >
人文閱讀與收藏·良友文學(xué)叢書:一天的工作
- >
山海經(jīng)