-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
機器學習Python版 版權信息
- ISBN:9787111706007
- 條形碼:9787111706007 ; 978-7-111-70600-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
機器學習Python版 本書特色
初學者入門指南,使用Python語言以及scikit-learn庫,掌握開發機器學習系統所需的流程、模式和策略
機器學習Python版 內容簡介
本書主要包括以下四個部分: **部分包括第1章到第4章。主要闡述有關機器學習的基本概念, 重點闡述基本分類器和回歸器的構建、訓練和評估。第二部分包括第5章到第7章。主要闡述機器學習系統的通用評估技術, 并使用通用評估技術對基本分類器和回歸器進行性能評估。第三部分包括第8章到第11章。主要闡述機器學習系統的重要學習技術工具庫, 如其他分類和回歸技術、特征工程。第11章討論了如何構建機器學習管道, 以及通過調整超參數改進機器學習系統的性能。第四部分包括第12章到第15章。主要介紹機器學習的*新技術, 包括組合機器學習模型、自動化特征工程模型, 并將機器學習應用干圖像和文本兩個特定領域。第15章簡單地介紹了神經網絡和圖形模型這兩個機器學習前沿技術。
機器學習Python版 目錄
推薦序
前言
作者簡介
**部分 機器學習入門
第1章 機器學習概論 2
1.1 歡迎來到機器學習的世界 2
1.2 范圍、術語、預測和數據 3
1.2.1 特征 4
1.2.2 目標值和預測值 5
1.3 讓機器開始機器學習 6
1.4 學習系統舉例 8
1.4.1 預測類別:分類器舉例 8
1.4.2 預測值:回歸器舉例 9
1.5 評估機器學習系統 10
1.5.1 準確率 10
1.5.2 資源消耗 11
1.6 創建機器學習系統的過程 12
1.7 機器學習的假設和現實 13
1.8 本章參考閱讀資料 15
1.8.1 本書內容 15
1.8.2 章節注釋 16
第2章 相關技術背景 18
2.1 編程環境配置 18
2.2 數學語言的必要性 18
2.3 用于解決機器學習問題的軟件 19
2.4 概率 20
2.4.1 基本事件 21
2.4.2 獨立性 22
2.4.3 條件概率 23
2.4.4 概率分布 24
2.5 線性組合、加權和以及點積 27
2.5.1 加權平均 29
2.5.2 平方和 31
2.5.3 誤差平方和 32
2.6 幾何視圖:空間中的點 33
2.6.1 直線 33
2.6.2 直線拓展 37
2.7 表示法和加1技巧 41
2.8 漸入佳境:突破線性和非線性 42
2.9 NumPy與“數學無所不在” 45
2.10 浮點數問題 49
2.11 本章參考閱讀資料 50
2.11.1 本章小結 50
2.11.2 章節注釋 51
第3章 預測類別:分類入門 52
3.1 分類任務 52
3.2 一個簡單的分類數據集 53
3.3 訓練和測試:請勿應試教育 55
3.4 評估:考試評分 58
3.5 簡單分類器#1:*近鄰分類器、遠距離關系和假設 59
3.5.1 定義相似性 60
3.5.2 k?-*近鄰中的k 61
3.5.3 答案組合 61
3.5.4 k?-*近鄰、參數和非參數方法 61
3.5.5 建立一個k?-*近鄰分類模型 62
3.6 簡單分類器#2:樸素貝葉斯分類器、
概率和違背承諾 64
3.7 分類器的簡單評估 66
3.7.1 機器學習的性能 66
3.7.2 分類器的資源消耗 67
3.7.3 獨立資源評估 73
3.8 本章參考閱讀資料 77
3.8.1 局限性和尚未解決的問題 77
3.8.2 本章小結 77
3.8.3 章節注釋 77
3.8.4 練習題 79
第4章 預測數值:回歸入門 80
4.1 一個簡單的回歸數據集 80
4.2 *近鄰回歸和匯總統計 82
4.2.1 中心度量方法:中位數和均值 83
4.2.2 構建一個k?-*近鄰回歸模型 85
4.3 線性回歸和誤差 86
4.3.1 地面總是不平坦的:為什么需要斜坡 86
4.3.2 傾斜直線 89
4.3.3 執行線性回歸 91
4.4 優化:選擇*佳答案 92
4.4.1 隨機猜測 92
4.4.2 隨機調整 93
4.4.3 智能調整 94
4.4.4 計算的捷徑 94
4.4.5 線性回歸的應用 95
4.5 回歸器的簡單評估和比較 95
4.5.1 均方根誤差 95
4.5.2 機器學習的性能 96
4.5.3 回歸過程中的資源消耗 96
4.6 本章參考閱讀資料 98
4.6.1 局限性和尚未解決的問題 98
4.6.2 本章小結 99
4.6.3 章節注釋 99
4.6.4 練習題 99
第二部分 通用評估技術
第5章 機器學習算法的評估和比較分析 102
5.1 評估和大道至簡的原則 102
5.2 機器學習階段的術語 103
5.2.1 有關機器的重新討論 104
5.2.2 更規范的闡述 106
5.3 過擬合和欠擬合 109
5.3.1 合成數據和線性回歸 109
5.3.2 手動操控模型的復雜度 111
5.3.3 金鳳花姑娘(“恰到好處”原則):可視化過擬合、欠擬合和“*佳擬合” 112
5.3.4 簡單性 115
5.3.5 關于過擬合必須牢記的注意事項 116
5.4 從誤差到成本 116
5.4.1 損失 116
5.4.2 成本 117
5.4.3 評分 118
5.5 (重新)抽樣:以少勝多 119
5.5.1 交叉驗證 119
5.5.2 分層抽樣 122
5.5.3 重復的訓練-測試集拆分 124
5.5.4 一種更好的方法和混排 127
5.5.5 留一交叉驗證 131
5.6 分解:將誤差分解為偏差和方差 132
5.6.1 數據的方差 133
5.6.2 模型的方差 133
5.6.3 模型的偏差 134
5.6.4 結合所有的因素 134
5.6.5 偏差-方差權衡示例 135
5.7 圖形可視化評估和比較 139
5.7.1 學習曲線:到底需要多少數據 139
5.7.2 復雜度曲線 141
5.8 使用交叉驗證比較機器學習模型 143
5.9 本章參考閱讀資料 144
5.9.1 本章小結 144
5.9.2 章節注釋 144
5.9.3 練習題 146
第6章 評估分類器 147
6.1 基線分類器 147
6.2 準確率以外:分類器的其他度量指標 149
6.2.1 從混淆矩陣中消除混淆 151
6.2.2 錯誤的方式 151
6.2.3 基于混淆矩陣的度量指標 152
6.2.4 混淆矩陣編碼 154
6.2.5 處理多元類別:多元類別平均 156
6
- >
月亮虎
- >
史學評論
- >
詩經-先民的歌唱
- >
經典常談
- >
推拿
- >
莉莉和章魚
- >
唐代進士錄
- >
苦雨齋序跋文-周作人自編集