智能科學與技術叢書機器學習:應用視角 版權信息
- ISBN:9787111668299
- 條形碼:9787111668299 ; 978-7-111-66829-9
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
智能科學與技術叢書機器學習:應用視角 本書特色
機器學習方法已成為各個領域科學家、研究人員、工程師和學生的重要工具。本書面向想要使用機器學習作為主要工具,而并不一定要成為機器學習研究人員的讀者。對于計算機科學專業機器學習方向的高年級本科生或低年級研究生,本書可作為教材和工具書。本書為希望使用機器學習過程來解決問題的讀者提供了很多知識和經驗,特別強調使用已有的工具和軟件包,而不是自己痛苦地編寫代碼。 本書特色 概述機器學習的主要應用領域,強調應用統計學中標準過程的有用性。 涵蓋每個想使用機器學習工具的人應該了解的機器學習思想,無論他們所屬的領域或從事的職業是什么。 覆蓋的領域足夠廣泛,以保證讀者順利入門,進而認識到哪些主題值得進一步探索。 強調利用現有的工具和軟件包快速解決實際問題。
智能科學與技術叢書機器學習:應用視角 內容簡介
本教材是一個機器學習工具箱,適用于計算機科學專業本科四年級或研究生一年級的學生。本書為那些想要使用機器學習過程來完成任務的人提供了許多主題,強調使用現有的工具和包,而不是自己重新編寫代碼。本書適用于從頭至尾的講授或閱讀,不同的講師或讀者有不同的需求。
智能科學與技術叢書機器學習:應用視角 目錄
譯者序
前言
致謝
關于作者
**部分 分類
第1章 學會分類2
1.1 分類的主要思想2
1.1.1 誤差率及其他性能指標2
1.1.2 更詳細的評估3
1.1.3 過擬合與交叉驗證4
1.2 *近鄰分類5
1.3 樸素貝葉斯7
1.3.1 利用交叉驗證進行模型選擇9
1.3.2 數據缺失11
編程練習11
第2章 支持向量機和隨機森林14
2.1 支持向量機14
2.1.1 鉸鏈損失15
2.1.2 正則化16
2.1.3 通過隨機梯度下降來尋找分類器17
2.1.4 λ的搜索19
2.1.5 總結:用隨機梯度下降訓練20
2.1.6 例子:利用支持向量機分析成人收入21
2.1.7 利用支持向量機進行多類分類23
2.2 利用隨機森林進行分類23
2.2.1 構造決策樹25
2.2.2 用信息增益來選擇劃分27
2.2.3 森林29
2.2.4 構造并評估決策森林29
2.2.5 利用決策森林進行數據分類30
編程練習31
MNIST練習33
第3章 學習理論初步35
3.1 用留出損失預測測試損失35
3.1.1 樣本均值和期望36
3.1.2 利用切比雪夫不等式37
3.1.3 一個泛化界37
3.2 有限分類器族的測試誤差與訓練誤差38
3.2.1 霍夫丁不等式39
3.2.2 在有限預測器族上訓練39
3.2.3 所需樣例數量40
3.3 無限預測器集合41
3.3.1 預測器和二值函數41
3.3.2 對稱化43
3.3.3 限制泛化誤差44
第二部分 高維數據
第4章 高維數據48
4.1 概述及簡單繪圖48
4.1.1 均值48
4.1.2 桿圖和散點圖矩陣49
4.1.3 協方差51
4.1.4 協方差矩陣52
4.2 維數災難53
4.2.1 災難:數據不是你想象的那樣53
4.2.2 維數的小困擾55
4.3 用均值和協方差理解高維數據55
4.3.1 仿射變換下的均值和協方差56
4.3.2 特征向量及矩陣對角化56
4.3.3 通過旋轉數據堆來對角化協方差矩陣57
4.4 多元正態分布58
4.4.1 仿射變換與高斯模型59
4.4.2 繪制二維高斯模型:協方差橢圓59
4.4.3 描述統計與期望60
4.4.4 維數災難的更多內容61
習題61
第5章 主成分分析64
5.1 在主成分上表示數據64
5.1.1 近似數據團塊64
5.1.2 例子:變換身高體重堆65
5.1.3 在主成分上表示數據67
5.1.4 低維表示中的誤差68
5.1.5 用NIPALS算法提取若干主成分69
5.1.6 主成分和缺失值70
5.1.7 PCA作為平滑方法71
5.2 例子:用主成分表示顏色72
5.3 例子:用主成分表示人臉75
習題77
編程練習78
第6章 低秩近似80
6.1 奇異值分解80
6.1.1 SVD和PCA81
6.1.2 SVD和低秩近似82
6.1.3 用SVD進行平滑82
6.2 多維縮放83
6.2.1 通過高維的距離選擇低維的點83
6.2.2 使用低秩近似分解因子84
6.2.3 例子:利用多維縮放進行映射85
6.3 例子:文本模型和潛在語義分析87
6.3.1 余弦距離88
6.3.2 對單詞計數進行平滑88
6.3.3 例子:對NIPS文檔進行映射89
6.3.4 獲得詞的含義90
6.3.5 例子:對NIPS數據集的詞進行映射92
6.3.6 TFIDF93
習題94
編程練習95
第7章 典型相關分析97
7.1 典型相關分析算法97
7.2 例子:在詞和圖片上進行CCA99
7.3 例子:在反射率和遮光上進行CCA102
編程練習105
第三部分 聚類
第8章 聚類108
8.1 聚合式聚類和拆分式聚類108
8.2 k均值算法及其變體111
8.2.1 如何選擇k的值114
8.2.2 軟分配115
8.2.3 高效聚類和層級式k均值117
8.2.4 k中心點算法117
8.2.5 例子:葡萄牙的雜貨117
8.2.6 關于k均值算法的一些見解119
8.3 用向量量化描述重復性120
8.3.1 向量量化121
8.3.2 例子:基于加速度計數據的行為123
編程練習126
第9章 使用概率模型進行聚類130
9.1 混合模型與聚類130
9.1.1 數據團塊的有限混合模型130
9.1.2 主題和主題模型132
9.2 EM算法133
9.2.1 例子——高斯混合:E步134
9.2.2 例子——高斯混合:M步136
9.2.3 例子——主題模型:E步136
9.2.4 例子——主題模型:M步137
9.2.5 EM算法的實踐137
習題140
編程練習140
第四部分 回歸
第10章 回歸144
10.1 概述144
10.2 線性回歸和*小二乘法146
10.2.1 線性回歸146
10.2.2 選擇β147
10.2.3 殘差148
10.2.4 R2149
展開全部
智能科學與技術叢書機器學習:應用視角 作者簡介
作者簡介.大衛·福賽斯(David Forsyth)于1989年在牛津大學貝利奧爾學院獲得博士學位,曾在艾奧瓦大學任教3年,在加州大學伯克利分校任教10年,之后到伊利諾伊大學任教。他是2000、2011、2018和2021年度IEEE計算機視覺和模式識別會議(CVPR)的程序委員會共同主席,2006年度CVPR和2008年度IEEE國際計算機視覺會議(ICCV)的大會共同主席,2008年度歐洲計算機視覺會議(ECCV)的程序委員會共同主席,而且是所有主要的計算機視覺國際會議的程序委員會成員。此外,他還在SIGGRAPH程序委員會任職了6屆。他于2006年獲得IEEE 技術成就獎,分別于2009年和2014成為IEEE會士和ACM會士。