機(jī)器學(xué)習(xí)公式詳解第2版 版權(quán)信息
- ISBN:9787115615725
- 條形碼:9787115615725 ; 978-7-115-61572-5
- 裝幀:一般膠版紙
- 冊(cè)數(shù):暫無(wú)
- 重量:暫無(wú)
- 所屬分類(lèi):>
機(jī)器學(xué)習(xí)公式詳解第2版 本書(shū)特色
適讀人群 :(1)高等院校人工智能、計(jì)算機(jī)、自動(dòng)化等相關(guān)專(zhuān)業(yè)機(jī)器學(xué)習(xí)方向的學(xué)生; (2)學(xué)術(shù)界機(jī)器學(xué)習(xí)領(lǐng)域的研究人員和教師; (3)工業(yè)界對(duì)機(jī)器學(xué)習(xí)感興趣的專(zhuān)業(yè)人員和工程師。(1)320個(gè)公式的詳細(xì)推導(dǎo)解析。
在充分捕捉第1版“南瓜書(shū)”的讀者需求后,第2版擴(kuò)充了對(duì)“西瓜書(shū)”解讀的覆蓋面,公式解讀數(shù)量由250個(gè)上升至320個(gè)。 (2)機(jī)器學(xué)習(xí)初學(xué)小白提升數(shù)學(xué)基礎(chǔ)能力的強(qiáng)推練習(xí)冊(cè)!
延續(xù)第1版思路,第2版以本科數(shù)學(xué)基礎(chǔ)視角對(duì)“西瓜書(shū)”中的內(nèi)容做了更進(jìn)一步的解讀:新增20個(gè)對(duì)“西瓜書(shū)”圖片/定理的解讀;新增數(shù)學(xué)知識(shí)的解讀,同時(shí)將其前置在所用到的章節(jié)處,不再以附注的形式給出,便于目錄查閱;在部分章節(jié)開(kāi)篇處加注學(xué)習(xí)建議和些許見(jiàn)解,進(jìn)一步照顧數(shù)學(xué)基礎(chǔ)薄弱的讀者。 (3)以開(kāi)源方式多人協(xié)作,內(nèi)容品質(zhì)已被廣大讀者認(rèn)可。 “南瓜書(shū)”P(pán)DF版開(kāi)源教程于2020年5月發(fā)布之初榮登 GitHub Trending第2,“南瓜書(shū)”紙質(zhì)版出版2年后,16次印刷共7萬(wàn)余冊(cè)。配套視頻【吃瓜教程】播放量超16.2萬(wàn),經(jīng)過(guò)開(kāi)源教程、圖書(shū)及視頻的充分迭代后,形成第2版“南瓜書(shū)”,質(zhì)量已被廣大讀者充分驗(yàn)證。 (4)俞勇、王斌、李沐、程明明、陳光(博主@愛(ài)可可-愛(ài)生活)、徐亦達(dá)等人工智能領(lǐng)域大咖親筆推薦。
機(jī)器學(xué)習(xí)公式詳解第2版 內(nèi)容簡(jiǎn)介
周志華老師的《機(jī)器學(xué)習(xí)》(俗稱(chēng)“西瓜書(shū)”)是機(jī)器學(xué)習(xí)領(lǐng)域的經(jīng)典入門(mén)教材之一。本書(shū)是《機(jī)器學(xué)習(xí)公式詳解》(俗稱(chēng)“南瓜書(shū)”)的第2 版。相較于第1 版,本書(shū)對(duì)“西瓜書(shū)”中除了公式以外的重、難點(diǎn)內(nèi)容加以解析,以過(guò)來(lái)人視角給出學(xué)習(xí)建議,旨在對(duì)比較難理解的公式和重點(diǎn)內(nèi)容擴(kuò)充具體的例子說(shuō)明,以及對(duì)跳步過(guò)大的公式補(bǔ)充具體的推導(dǎo)細(xì)節(jié)。
全書(shū)共16 章,與“西瓜書(shū)”章節(jié)、公式對(duì)應(yīng),每個(gè)公式的推導(dǎo)和解釋都以本科數(shù)學(xué)基礎(chǔ)的視角進(jìn)行講解,希望能夠幫助讀者快速掌握各個(gè)機(jī)器學(xué)習(xí)算法背后的數(shù)學(xué)原理。
本書(shū)思路清晰,視角獨(dú)特,結(jié)構(gòu)合理,可作為高等院校計(jì)算機(jī)及相關(guān)專(zhuān)業(yè)的本科生或研究生教材,也可供對(duì)機(jī)器學(xué)習(xí)感興趣的研究人員和工程技術(shù)人員閱讀參考
機(jī)器學(xué)習(xí)公式詳解第2版 目錄
序(王斌 小米AI 實(shí)驗(yàn)室主任、NLP 首席科學(xué)家)
前言
主要符號(hào)表
資源與支持
第 1 章 緒論 1
1.1 引言 1
1.2 基本術(shù)語(yǔ) 1
1.3 假設(shè)空間 5
1.4 歸納偏好 5
1.4.1 式(1.1) 和式(1.2) 的解釋 6
第 2 章 模型評(píng)估與選擇 8
2.1 經(jīng)驗(yàn)誤差與過(guò)擬合 8
2.2 評(píng)估方法 9
2.2.1 算法參數(shù)(超參數(shù))與模型參數(shù) 10
2.2.2 驗(yàn)證集 10
2.3 性能度量 11
2.3.1 式(2.2) ~ 式(2.7) 的解釋 11
2.3.2 式(2.8) 和式(2.9) 的解釋 11
2.3.3 圖2.3 的解釋 11
2.3.4 式(2.10) 的推導(dǎo) 11
2.3.5 式(2.11) 的解釋 12
2.3.6 式(2.12) ~ 式(2.17) 的解釋 13
2.3.7 式(2.18) 和式(2.19) 的解釋 13
2.3.8 式(2.20) 的推導(dǎo) 14
2.3.9 式(2.21) 和式(2.22) 的推導(dǎo) 16
2.3.10 式(2.23) 的解釋 18
2.3.11 式(2.24) 的解釋 19
2.3.12 式(2.25) 的解釋 20
2.4 比較檢驗(yàn) 22
2.4.1 式(2.26) 的解釋 22
2.4.2 式(2.27) 的推導(dǎo) 23
2.5 偏差與方差 26
2.5.1 式(2.37) ~ 式(2.42) 的推導(dǎo) 26
參考文獻(xiàn) 29
第3 章 線性模型 30
3.1 基本形式 30
3.2 線性回歸 30
3.2.1 屬性數(shù)值化 30
3.2.2 式(3.4) 的解釋 31
3.2.3 式(3.5) 的推導(dǎo) 32
3.2.4 式(3.6) 的推導(dǎo) 32
3.2.5 式(3.7) 的推導(dǎo) 33
3.2.6 式(3.9) 的推導(dǎo) 35
3.2.7 式(3.10) 的推導(dǎo) 36
3.2.8 式(3.11) 的推導(dǎo) 36
3.3 對(duì)率回歸 39
3.3.1 式(3.27) 的推導(dǎo) 39
3.3.2 梯度下降法 41
3.3.3 牛頓法 42
3.3.4 式(3.29) 的解釋 44
3.3.5 式(3.30) 的推導(dǎo) 44
3.3.6 式(3.31) 的推導(dǎo) 45
3.4 線性判別分析 46
3.4.1 式(3.32) 的推導(dǎo) 46
3.4.2 式(3.37) ~ 式(3.39) 的推導(dǎo) 47
3.4.3 式(3.43) 的推導(dǎo) 48
3.4.4 式(3.44) 的推導(dǎo) 48
3.4.5 式(3.45) 的推導(dǎo) 49
3.5 多分類(lèi)學(xué)習(xí) 52
3.5.1 圖3.5 的解釋 52
3.6 類(lèi)別不平衡問(wèn)題 52
參考文獻(xiàn) 52
第4 章 決策樹(shù) 53
4.1 基本流程 53
4.2 劃分選擇 54
4.2.1 式(4.1) 的解釋 54
4.2.2 式(4.2) 的解釋 58
4.2.3 式(4.4) 的解釋 58
4.2.4 式(4.5) 的推導(dǎo) 59
4.2.5 式(4.6) 的解釋 59
4.3 剪枝處理 62
4.4 連續(xù)值與缺失值 63
4.4.1 式(4.7) 的解釋 63
4.4.2 式(4.8) 的解釋 64
4.4.3 式(4.12) 的解釋 64
4.5 多變量決策樹(shù) 64
4.5.1 圖4.10 的解釋 65
4.5.2 圖4.11 的解釋 65
參考文獻(xiàn) 66
第5 章 神經(jīng)網(wǎng)絡(luò) 67
5.1 神經(jīng)元模型 67
5.2 感知機(jī)與多層網(wǎng)絡(luò) 67
5.2.1 式(5.1) 和式(5.2) 的推導(dǎo) 67
5.2.2 圖5.5 的解釋 70
5.3 誤差逆?zhèn)鞑ニ惴? 70
5.3.1 式(5.10) 的推導(dǎo) 70
5.3.2 式(5.12) 的推導(dǎo) 70
5.3.3 式(5.13) 的推導(dǎo) 71
5.3.4 式(5.14) 的推導(dǎo) 72
5.3.5 式(5.15) 的推導(dǎo) 73
5.4 全局*小與局部極小 73
5.5 其他常見(jiàn)神經(jīng)網(wǎng)絡(luò) 73
5.5.1 式(5.18) 的解釋 73
5.5.2 式(5.20) 的解釋 73
5.5.3 式(5.22) 的解釋 74
5.5.4 式(5.23) 的解釋 74
5.6 深度學(xué)習(xí) 74
5.6.1 什么是深度學(xué)習(xí) 75
5.6.2 深度學(xué)習(xí)的起源 75
5.6.3 怎么理解特征學(xué)習(xí) 75
參考文獻(xiàn) 75
第6 章 支持向量機(jī) 77
6.1 間隔與支持向量 77
6.1.1 圖6.1 的解釋 77
6.1.2 式(6.1) 的解釋 77
6.1.3 式(6.2) 的推導(dǎo) 78
6.1.4 式(6.3) 的推導(dǎo) 78
6.1.5 式(6.4) 的推導(dǎo) 80
6.1.6 式(6.5) 的解釋 80
6.2 對(duì)偶問(wèn)題 80
6.2.1 凸優(yōu)化問(wèn)題 80
6.2.2 KKT 條件 80
6.2.3 拉格朗日對(duì)偶函數(shù) 81
6.2.4 拉格朗日對(duì)偶問(wèn)題 82
6.2.5 式(6.9) 和式(6.10) 的推導(dǎo) 85
6.2.6 式(6.11) 的推導(dǎo) 85
6.2.7 式(6.13) 的解釋 86
6.3 核函數(shù) 87
6.3.1 式(6.22) 的解釋 87
6.4 軟間隔與正則化 87
6.4.1 式(6.35) 的推導(dǎo) 87
6.4.2 式(6.37) 和式(6.38) 的推導(dǎo) 87
6.4.3 式(6.39) 的推導(dǎo) 87
6.4.4 式(6.40) 的推導(dǎo) 88
6.4.5 對(duì)率回歸與支持向量機(jī)的關(guān)系 88
6.4.6 式(6.41) 的解釋 89
6.5 支持向量回歸 89
6.5.1 式(6.43) 的解釋 89
6.5.2 式(6.45) 的推導(dǎo) 90
6.5.3 式(6.52) 的推導(dǎo) 91
6.6 核方法 92
6.6.1 式(6.57) 和式(6.58) 的解釋 92
6.6.2 式(6.65) 的推導(dǎo) 92
6.6.3 式(6.66) 和式(6.67) 的解釋 93
6.6.4 式(6.70) 的推導(dǎo) 94
6.6.5 核對(duì)率回歸 98
參考文獻(xiàn) 99
第7 章 貝葉斯分類(lèi)器 100
7.1 貝葉斯決策論 100
7.1.1 式(7.5) 的推導(dǎo) 100
7.1.2 式(7.6) 的推導(dǎo) 100
7.1.3 判別式模型與生成式模型 100
7.2 極大似然估計(jì) 101
7.2.1 式(7.12) 和式(7.13) 的推導(dǎo) 101
7.3 樸素貝葉斯分類(lèi)器 104
7.3.1 式(7.16) 和式(7.17) 的解釋 104
7.3.2 式(7.18) 的解釋 104
7.3.3 貝葉斯估計(jì) 105
7.3.4 Categorical 分布 105
7.3.5 Dirichlet 分布 106
7.3.6 式(7.19) 和式(7.20) 的推導(dǎo) 106
7.4 半樸素貝葉斯分類(lèi)器 110
7.4.1 式(7.21) 的解釋 110
7.4.2 式(7.22) 的解釋 111
7.4.3 式(7.23) 的推導(dǎo) 111
7.4.4 式(7.24) 和式(7.25) 的推導(dǎo) 112
7.5 貝葉斯網(wǎng) 112
7.5.1 式(7.27) 的解釋 112
7.6 EM 算法 113
7.6.1 Jensen 不等式 113
7.6.2 EM 算法的推導(dǎo) 113
參考文獻(xiàn) 121
第8 章 集成學(xué)習(xí) 122
8.1 個(gè)體與集成 123
8.1.1 式(8.1) 的解釋 123
8.1.2 式(8.2) 的解釋 123
8.1.3 式(8.3) 的推導(dǎo) 123
8.2 Boosting 124
8.2.1 式(8.4) 的解釋 125
8.2.2 式(8.5) 的解釋 125
8.2.3 式(8.6) 的推導(dǎo) 126
8.2.4 式(8.7) 的推導(dǎo) 126
8.2.5 式(8.8) 的推導(dǎo) 127
8.2.6 式(8.9) 的推導(dǎo) 127
8.2.7 式(8.10) 的解釋 128
8.2.8 式(8.11) 的推導(dǎo) 128
8.2.9 式(8.12) 的解釋 129
8.2.10 式(8.13) 的推導(dǎo) 129
8.2.11 式(8.14) 的推導(dǎo) 130
8.2.12 式(8.16) 的推導(dǎo) 131
8.2.13 式(8.17) 的推導(dǎo) 131
8.2.14 式(8.18) 的推導(dǎo) 132
8.2.15 式(8.19) 的推導(dǎo) 132
8.2.16 AdaBoost 的個(gè)人推導(dǎo) 133
8.2.17 進(jìn)一步理解權(quán)重更新公式 137
8.2.18 能夠接受帶權(quán)樣本的基學(xué)習(xí)算法 139
8.3 Bagging 與隨機(jī)森林 140
8.3.1 式(8.20) 的解釋 140
8.3.2 式(8.21) 的推導(dǎo) 140
8.3.3 隨機(jī)森林的解釋 141
8.4 結(jié)合策略 141
8.4.1 式(8.22) 的解釋 141
8.4.2 式(8.23) 的解釋 141
8.4.3 硬投票和軟投票的解釋 141
8.4.4 式(8.24) 的解釋 142
8.4.5 式(8.25) 的解釋 142
8.4.6 式(8.26) 的解釋 142
8.4.7 元學(xué)習(xí)器的解釋 142
8.4.8 Stacking 算法的解釋 143
8.5 多樣性 143
8.5.1 式(8.27) 的解釋 143
8.5.2 式(8.28) 的解釋 143
8.5.3 式(8.29) 的解釋 143
8.5.4 式(8.30) 的解釋 144
8.5.5 式(8.31) 的推導(dǎo) 144
8.5.6 式(8.32) 的解釋 144
8.5.7 式(8.33) 的解釋 145
8.5.8 式(8.34) 的解釋 145
8.5.9 式(8.35) 的解釋 145
8.5.10 式(8.36) 的解釋 145
8.5.11 式(8.40) 的解釋 145
8.5.12 式(8.41) 的解釋 146
8.5.13 式(8.42) 的解釋 146
8.5.14 多樣性增強(qiáng)的解釋 146
8.6 Gradient Boosting、GBDT、XGBoost的聯(lián)系與區(qū)別 147
8.6.1 從梯度下降的角度解釋AdaBoost 147
8.6.2 梯度提升 149
8.6.3 梯度提升樹(shù)(GBDT) 151
8.6.4 XGBoost 152
參考文獻(xiàn) 152
第9 章 聚類(lèi) 153
9.1 聚類(lèi)任務(wù) 153
9.2 性能度量 153
9.2.1 式(9.5) 的解釋 153
9.2.2 式(9.6) 的解釋 155
9.2.3 式(9.7) 的解釋 155
9.2.4 式(9.8) 的解釋 156
9.2.5 式(9.12) 的解釋 156
9.3 距離計(jì)算 156
9.3.1 式(9.21) 的解釋 156
9.4 原型聚類(lèi) 157
9.4.1 式(9.28) 的解釋 157
9.4.2 式(9.29) 的解釋 157
9.4.3 式(9.30) 的解釋 158
9.4.4 式(9.31) 的解釋 159
9.4.5 式(9.32) 的解釋 159
9.4.6 式(9.33) 的推導(dǎo) 160
9.4.7 式(9.34) 的推導(dǎo) 161
9.4.8 式(9.35) 的推導(dǎo) 162
9.4.9 式(9.36) 的解釋 164
9.4.10 式(9.37) 的推導(dǎo) 164
9.4.11 式(9.38) 的推導(dǎo) 165
9.4.12 圖9.6 的解釋 166
9.5 密度聚類(lèi) 166
9.5.1 密度直達(dá)、密度可達(dá)與密度相連 167
9.5.2 圖9.9 的解釋 168
9.6 層次聚類(lèi) 168
第 10 章 降維與度量學(xué)習(xí) 170
10.1 預(yù)備知識(shí) 170
10.1.1 符號(hào)約定 170
10.1.2 矩陣與單位陣、向量的乘法 170
10.2 矩陣的F 范數(shù)與跡 171
10.3 k 近鄰學(xué)習(xí) 173
10.3.1 式(10.1) 的解釋 173
10.3.2 式(10.2) 的推導(dǎo) 174
10.4 低維嵌入 175
10.4.1 圖10.2 的解釋 175
10.4.2 式(10.3) 的推導(dǎo) 175
10.4.3 式(10.4) 的推導(dǎo) 176
10.4.4 式(10.5) 的推導(dǎo) 177
10.4.5 式(10.6) 的推導(dǎo) 177
10.4.6 式(10.10) 的推導(dǎo) 178
10.4.7 式(10.11) 的解釋 179
10.4.8 圖10.3 關(guān)于MDS 算法的解釋 179
10.5 主成分分析 180
10.5.1 式(10.14) 的推導(dǎo) 180
10.5.2 式(10.16) 的解釋 184
10.5.3 式(10.17) 的推導(dǎo) 186
10.5.4 根據(jù)式(10.17) 求解式(10.16) 188
10.6 核化線性降維 188
10.6.1 式(10.19) 的解釋 189
10.6.2 式(10.20) 的解釋 189
10.6.3 式(10.21) 的解釋 190
10.6.4 式(10.22) 的解釋 190
10.6.5 式(10.24) 的推導(dǎo) 190
10.6.6 式(10.25) 的解釋 191
10.7 流形學(xué)習(xí) 191
10.7.1 等度量映射(Isomap) 的解釋 191
10.7.2 式(10.28) 的推導(dǎo) 192
10.7.3 式(10.31) 的推導(dǎo) 194
10.8 度量學(xué)習(xí) 196
10.8.1 式(10.34) 的解釋 196
10.8.2 式(10.35) 的解釋 197
10.8.3 式(10.36) 的解釋 197
10.8.4 式(10.37) 的解釋 198
10.8.5 式(10.38) 的解釋 198
10.8.6 式(10.39) 的解釋 198
參考文獻(xiàn) 199
第 11 章 特征選擇與稀疏學(xué)習(xí) 200
11.1 子集搜索與評(píng)價(jià) 200
11.1.1 式(11.1) 的解釋 200
11.1.2 式(11.2) 的解釋 200
11.2 過(guò)濾式選擇 201
11.3 包裹式選擇 201
11.4 嵌入式選擇與L1 正則化 202
11.4.1 式(11.5) 的解釋 202
11.4.2 式(11.6) 的解釋 202
11.4.3 式(11.7) 的解釋 203
11.4.4 式(11.8) 的解釋 203
11.4.5 式(11.9) 的解釋 203
11.4.6 式(11.10) 的推導(dǎo) 203
11.4.7 式(11.11) 的解釋 205
11.4.8 式(11.12) 的解釋 205
11.4.9 式(11.13) 的解釋 205
11.4.10 式(11.14) 的推導(dǎo) 205
11.5 稀疏表示與字典學(xué)習(xí) 208
11.5.1 式(11.15) 的解釋 208
11.5.2 式(11.16) 的解釋 208
11.5.3 式(11.17) 的推導(dǎo) 208
11.5.4 式(11.18) 的推導(dǎo) 208
11.6 壓縮感知 213
11.6.1 式(11.21) 的解釋 213
11.6.2 式(11.25) 的解釋 213
參考文獻(xiàn) 214
第 12 章 計(jì)算學(xué)習(xí)理論 215
12.1 基礎(chǔ)知識(shí) 215
12.1.1 式(12.1) 的解釋 216
12.1.2 式(12.2) 的解釋 216
12.1.3 式(12.3) 的解釋 216
12.1.4 式(12.4) 的解釋 216
12.1.5 式(12.5) 和式(12.6) 的解釋 216
12.1.6 式(12.7) 的解釋 217
12.2 PAC 學(xué)習(xí) 217
12.2.1 式(12.9) 的解釋 218
12.3 有限假設(shè)空間 218
12.3.1 式(12.10) 的解釋 219
12.3.2 式(12.11) 的解釋 219
12.3.3 式(12.12) 的推導(dǎo) 219
12.3.4 式(12.13) 的解釋 220
12.3.5 式(12.14) 的推導(dǎo) 220
12.3.6 引理12.1 的解釋 221
12.3.7 式(12.18) 的推導(dǎo) 221
12.3.8 式(12.19) 的推導(dǎo) 221
12.3.9 式(12.20) 的解釋 222
12.4 VC 維 223
12.4.1 式(12.21) 的解釋 223
12.4.2 式(12.22) 的解釋 223
12.4.3 式(12.23) 的解釋 224
12.4.4 引理12.2 的解釋 224
12.4.5 式(12.28) 的解釋 226
12.4.6 式(12.29) 的解釋 227
12.4.7 式(12.30) 的解釋 227
12.4.8 定理12.4 的解釋 228
12.5 Rademacher 復(fù)雜度 229
12.5.1 式(12.36) 的解釋 229
12.5.2 式(12.37) 的解釋 229
12.5.3 式(12.38) 的解釋 230
12.5.4 式(12.39) 的解釋 230
12.5.5 式(12.40) 的解釋 231
12.5.6 式(12.41) 的解釋 231
12.5.7 定理12.5 的解釋 231
12.6 定理12.6 的解釋 233
12.6.1 式(12.52) 的證明 235
12.6.2 式(12.53) 的推導(dǎo) 235
12.7 穩(wěn)定性 235
12.7.1 泛化損失/經(jīng)驗(yàn)損失/留一損失的解釋 236
12.7.2 式(12.57) 的解釋 236
12.7.3 定理12.8 的解釋 236
12.7.4 式(12.60) 的推導(dǎo) 237
12.7.5 經(jīng)驗(yàn)損失*小化 237
12.7.6 定理12.9 的證明的解釋 237
參考文獻(xiàn) 238
第 13 章 半監(jiān)督學(xué)習(xí) 240
13.1 未標(biāo)記樣本 240
13.2 生成式方法 240
13.2.1 式(13.1) 的解釋 241
13.2.2 式(13.2) 的推導(dǎo) 241
13.2.3 式(13.3) 的推導(dǎo) 242
13.2.4 式(13.4) 的推導(dǎo) 242
13.2.5 式(13.5) 的解釋 242
13.2.6 式(13.6) 的解釋 243
13.2.7 式(13.7) 的解釋 244
13.2.8 式(13.8) 的解釋 246
13.3 半監(jiān)督SVM 248
13.3.1 圖13.3 的解釋 248
13.3.2 式(13.9) 的解釋 248
13.3.3 圖13.4 的解釋 248
13.3.4 式(13.10) 的解釋 250
13.4 圖半監(jiān)督學(xué)習(xí) 250
13.4.1 式(13.12) 的推導(dǎo) 251
13.4.2 式(13.13) 的推導(dǎo) 252
13.4.3 式(13.14) 的推導(dǎo) 253
13.4.4 式(13.15) 的推導(dǎo) 253
13.4.5 式(13.16) 的解釋 254
13.4.6 式(13.17) 的推導(dǎo) 254
13.4.7 式(13.18) 的解釋 254
13.4.8 式(13.20) 的解釋 254
13.4.9 式(13.21) 的推導(dǎo) 255
13.5 基于分歧的方法 259
13.5.1 圖13.6 的解釋 259
13.6 半監(jiān)督聚類(lèi) 260
13.6.1 圖13.7 的解釋 260
13.6.2 圖13.9 的解釋 260
參考文獻(xiàn) 260
第 14 章 概率圖模型 261
14.1 隱馬爾可夫模型 261
14.1.1 生成式模型和判別式模型 261
14.1.2 式(14.1) 的推導(dǎo) 262
14.1.3 隱馬爾可夫模型的三組參數(shù) 263
14.2 馬爾可夫隨機(jī)場(chǎng) 263
14.2.1 式(14.2) 和式(14.3) 的解釋 263
14.2.2 式(14.4) ~ 式(14.7) 的推導(dǎo) 264
14.2.3 馬爾可夫毯 264
14.2.4 勢(shì)函數(shù) 265
14.2.5 式(14.8) 的解釋 265
14.2.6 式(14.9) 的解釋 265
14.3 條件隨機(jī)場(chǎng) 265
14.3.1 式(14.10) 的解釋 265
14.3.2 式(14.11) 的解釋 266
14.4 學(xué)習(xí)與推斷 266
14.4.1 式(14.14) 的推導(dǎo) 266
14.4.2 式(14.15) 和式(14.16) 的推導(dǎo) 266
14.4.3 式(14.17) 的解釋 267
14.4.4 式(14.18) 的推導(dǎo) 267
14.4.5 式(14.19) 的解釋 267
14.4.6 式(14.20) 的解釋 268
14.4.7 式(14.22) 的推導(dǎo) 268
14.4.8 圖14.8 的解釋 269
14.5 近似推斷 269
14.5.1 式(14.21) ~ 式(14.25) 的解釋 269
14.5.2 式(14.26) 的解釋 270
14.5.3 式(14.27) 的解釋 270
14.5.4 式(14.28) 的推導(dǎo) 270
14.5.5 吉布斯采樣與MH 算法 271
14.5.6 式(14.29) 的解釋 272
14.5.7 式(14.30) 的解釋 272
14.5.8 式(14.31) 的解釋 273
14.5.9 式(14.32) ~ 式(14.34) 的推導(dǎo) 273
14.5.10 式(14.35) 的解釋 274
14.5.11 式(14.36) 的推導(dǎo) 274
14.5.12 式(14.37) 和式(14.38) 的解釋 276
14.5.13 式(14.39) 的解釋 277
14.5.14 式(14.40) 的解釋 277
14.6 話題模型 278
14.6.1 式(14.41) 的解釋 278
14.6.2 式(14.42) 的解釋 279
14.6.3 式(14.43) 的解釋 279
14.6.4 式(14.44) 的解釋 279
參考文獻(xiàn) 279
第 15 章 規(guī)則學(xué)習(xí) 280
15.1 剪枝優(yōu)化 280
15.1.1 式(15.2) 和式(15.3) 的解釋 280
15.2 歸納邏輯程序設(shè)計(jì) 281
15.2.1 式(15.6) 的解釋 281
15.2.2 式(15.7) 的推導(dǎo) 281
15.2.3 式(15.9) 的推導(dǎo) 281
15.2.4 式(15.10) 的解釋 281
15.2.5 式(15.11) 的解釋 281
15.2.6 式(15.12) 的解釋 282
15.2.7 式(15.13) 的解釋 282
15.2.8 式(15.16) 的推導(dǎo) 282
第 16 章 強(qiáng)化學(xué)習(xí) 283
16.1 任務(wù)與獎(jiǎng)賞 283
16.2 K-搖臂賭博機(jī) 283
16.2.1 式(16.2) 和式(16.3) 的推導(dǎo) 283
16.2.2 式(16.4) 的解釋 283
16.3 有模型學(xué)習(xí) 284
16.3.1 式(16.7) 的解釋 284
16.3.2 式(16.8) 的推導(dǎo) 284
16.3.3 式(16.10) 的推導(dǎo) 285
16.3.4 式(16.14) 的解釋 285
16.3.5 式(16.15) 的解釋 285
16.3.6 式(16.16) 的推導(dǎo) 285
16.4 免模型學(xué)習(xí) 286
16.4.1 式(16.20) 的解釋 286
16.4.2 式(16.23) 的解釋 286
16.4.3 式(16.31) 的推導(dǎo) 286
16.5 值函數(shù)近似 287
16.5.1 式(16.33) 的解釋 287
16.5.2 式(16.34) 的推導(dǎo) 287
參考文獻(xiàn) 287
展開(kāi)全部
機(jī)器學(xué)習(xí)公式詳解第2版 作者簡(jiǎn)介
謝文睿
北京工業(yè)大學(xué)碩士,Datawhale開(kāi)源項(xiàng)目負(fù)責(zé)人,百度算法工程師,研究方向?yàn)闄C(jī)器學(xué)習(xí)與自然語(yǔ)言處理。 秦州
康奈爾大學(xué)計(jì)算機(jī)碩士,Datawhale成員,阿里巴巴算法專(zhuān)家,研究方向?yàn)閳D計(jì)算與自然語(yǔ)言處理, 在NeurIPS、AAAI、CIKM等會(huì)議上錄用多篇學(xué)術(shù)論文并獲得CIKM 2019最佳應(yīng)用論文獎(jiǎng)。 賈彬彬
工學(xué)博士,蘭州理工大學(xué)講師,研究方向?yàn)闄C(jī)器學(xué)習(xí)與數(shù)據(jù)挖掘,在TKDE、TNNLS、PRJ、ICML、AAAI等期刊和會(huì)議上共發(fā)表學(xué)術(shù)論文十余篇,并擔(dān)任ICML、NeurIPS、ICLR、AAAI、IJCAI 等會(huì)議的程序委員會(huì)委員(PC Member)。