中圖網小程序
一鍵登錄
更方便
本類五星書更多>
-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰(zhàn)行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優(yōu)實踐之路
-
>
第一行代碼Android
-
>
JAVA持續(xù)交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
Python機器學習案例教程(原書第2版)/大數據叢書 版權信息
- ISBN:9787111677109
- 條形碼:9787111677109 ; 978-7-111-67710-9
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>
Python機器學習案例教程(原書第2版)/大數據叢書 內容簡介
本書包括3部分:部分介紹機器學習的基本概念,它們是機器學習的預備知識;第2部分系統介紹幾種成熟的機器學習算法和技術;第3部分介紹貫穿整個機器學習工作流程的21個很好案例,并且討論具有前瞻性的方法和想法,它們被認可為是機器學習未來的研究重點。本書中的代碼均在Python 3中測試通過。 本書適合高等院校相關專業(yè)的大學生、研究生或教師閱讀學習,以及不具有機器學習或統計背景但是想要快速補充機器學習算法知識,以便在實際產品或平臺中應用的軟件工程師。
Python機器學習案例教程(原書第2版)/大數據叢書 目錄
譯者序
前言
第1部分機器學習的基礎
第1章機器學習和Python入門
11超高水平的機器學習技術概述
111機器學習任務的分類
112機器學習算法的發(fā)展簡史
12機器學習的核心——數據泛化
121過擬合、欠擬合和偏差-方差權衡
122利用交叉驗證避免過擬合
123利用正則化避免過擬合
124通過特征選擇和降維避免過擬合
13預處理、探索和特征工程
131缺失值
132標簽編碼
133獨熱編碼
134縮放
135多項式特征
136冪變換
137分箱
14組合模型
141投票法和平均法
142裝袋法
143提升方法
144堆疊法
15安裝軟件和設置
151設置Python和環(huán)境
152安裝各種軟件包
本章小結
習題
第2部分Python機器學習實例
第2章使用文本分析技術研究20組新聞數據集
21計算機如何理解語言——NLP
22瀏覽NLP庫并學習NLP基礎知識
221語料庫
222標記
223詞性
224命名實體識別
225詞干提取和詞形還原
226語義和主題建模
23獲取新聞組數據
24研究新聞組數據
25考慮文本數據的特性
251計算每個單詞表征的出現次數
252文本預處理
253丟棄停止詞
254詞干提取和詞形還原法
26使用t-SNE可視化新聞組數據
261什么是降維
262用于降維的t-SNE
本章小結
習題
第3章使用聚類和主題建模算法挖掘20組新聞數據集
31沒有指導的學習——無監(jiān)督學習
32使用k均值聚類算法對新聞數據集進行聚類
321k均值聚類算法是如何聚類的?
322從頭實現k均值聚類算法
323用機器學習實現k均值聚類算法
324k值的選擇
325使用k均值聚類新聞組數據
33在新聞組中發(fā)現基礎主題
34使用NMF進行主題建模
35使用LDA進行主題建模
本章小結
習題
第4章使用樸素貝葉斯檢測垃圾郵件
41從分類開始
411分類算法的類型
412文本分類的應用
42探索樸素貝葉斯
421通過案例來學習貝葉斯定理
422樸素貝葉斯的結構
423運用scratch庫實現樸素貝葉斯分類器
424運用scikit-learn庫實現樸素貝葉斯分類器
43分類性能評估
44模型調優(yōu)和交叉驗證
本章小結
習題
第5章使用支持向量機對新聞組主題進行分類
51用支持向量機尋找分離邊界
511通過不同的示例了解支持向量機如何工作
512實現支持向量機
513支持向量機的核心
514在線性核和RBF核之間進行選擇
52使用支持向量機對新聞組主題進行分類
53更多示例——心臟造影的胎兒狀態(tài)分類
54另一個示例——使用TensorFlow完成基于支持向量機的乳腺癌分類
本章小結
習題
第6章使用基于樹的算法預測在線廣告點擊率
61廣告點擊率預測概述
62兩種類型數據:數值型和分類型
63從根到葉探索決策樹
631構建決策樹
632衡量分裂的標準
64從頭實現決策樹
65用決策樹預測廣告點擊率
66集成決策樹——隨機森林
661使用TensorFlow實現隨機森林
本章小結
習題
第7章使用邏輯回歸預測在線廣告點擊率
71將分類特征轉換為數字特征——獨熱編碼和順序編碼
72用邏輯回歸對數據進行分類
721邏輯函數入門
722從邏輯函數到邏輯回歸
73訓練邏輯回歸模型
731利用梯度下降訓練邏輯回歸模型
732利用梯度下降的邏輯回歸模型預測在線廣告點擊率
733利用隨機梯度下降訓練邏輯回歸模型
734利用正則化訓練邏輯回歸模型
74通過在線學習訓練大型數據集
75處理多元分類
76使用TensorFlow實現邏輯回歸
77使用隨機森林進行特征選擇
本章小結
習題
第8章將預測擴展到TB級點擊日志
81學習Apache Spark的基本知識
811了解 Spark
812安裝Spark
813啟動和部署Spark程序
82在PySpark中編程
83使用Spark學習大量點擊日志
831加載點擊日志
832拆分和緩存數據
833對分類特征進行獨熱編碼
834訓練和測試邏輯回歸模型
84使用Spark對分類變量進行特征工程
841散列分類特征
842組合多個變量——特征交互
本章小結
習題
第9章使用回歸算法預測股票價格
91有關股票市場和股票價格的簡要概述
92什么是回歸
93獲取股價數據
931開始特征工程
932獲取數據并生成特征
94使用線性回歸來估計
941線性回歸是如何工作的
942實現線性回歸
95使用回歸樹進行預測
951從分類樹到回歸樹
952實現回歸樹
953實現隨機森林
96用支持向量回歸機進行評估
961實現支持向量回歸機
97用神經網絡進行估算
971揭開神經網絡的神秘面紗
972實現神經網絡
98評估回歸性能
99使用四種回歸算法預測股票價格
本章小結
習題
第3部分Python機器學習*佳案例
第10章機器學習*佳案例
101機器學習解決方案流程
102數據準備階段的*佳案例
1021*佳案例1——完全理解項目目標
1022*佳案例2——收集所有相關的特征
1023*佳案例3——保持特征值的一致性
1024*佳案例4——處理缺失數據
1025*佳案例5——存儲大規(guī)模數據
103訓練集生成階段的*佳案例
1031*佳案例6——區(qū)分分類型特征與數值型特征
1032*佳案例7——決定是否要對分類型特征進行編碼
1033*佳案例8——決定是否要選擇特征和如何選擇
1034*佳案例9——決定是否要降維和如何降維
1035*佳案例10——決定是否重新調整特征取值
1036*佳案例11——在擁有專業(yè)知識的條件下進行特征工程
1037*佳案例12——在缺少專業(yè)知識的條件下進行特征工程
1038*佳案例13——記錄每個特征是如何生成的
1039*佳案例14——從文本數據中提取特征
104模型訓練、評估和選擇階段的*佳案例
1041*佳案例15——選擇合適的起步算法
1042*佳案例16——減少過擬合
1043*佳案例17——識別過擬合與欠擬合
1044*佳案例18——在大型數據集上建模
105部署和監(jiān)視階段的*佳案例
1051*佳案例19——保存、加載和重用模型
1052*佳案例20——監(jiān)控模型性能
1053*佳案例21——定期更新模型
本章小結
習題
前言
第1部分機器學習的基礎
第1章機器學習和Python入門
11超高水平的機器學習技術概述
111機器學習任務的分類
112機器學習算法的發(fā)展簡史
12機器學習的核心——數據泛化
121過擬合、欠擬合和偏差-方差權衡
122利用交叉驗證避免過擬合
123利用正則化避免過擬合
124通過特征選擇和降維避免過擬合
13預處理、探索和特征工程
131缺失值
132標簽編碼
133獨熱編碼
134縮放
135多項式特征
136冪變換
137分箱
14組合模型
141投票法和平均法
142裝袋法
143提升方法
144堆疊法
15安裝軟件和設置
151設置Python和環(huán)境
152安裝各種軟件包
本章小結
習題
第2部分Python機器學習實例
第2章使用文本分析技術研究20組新聞數據集
21計算機如何理解語言——NLP
22瀏覽NLP庫并學習NLP基礎知識
221語料庫
222標記
223詞性
224命名實體識別
225詞干提取和詞形還原
226語義和主題建模
23獲取新聞組數據
24研究新聞組數據
25考慮文本數據的特性
251計算每個單詞表征的出現次數
252文本預處理
253丟棄停止詞
254詞干提取和詞形還原法
26使用t-SNE可視化新聞組數據
261什么是降維
262用于降維的t-SNE
本章小結
習題
第3章使用聚類和主題建模算法挖掘20組新聞數據集
31沒有指導的學習——無監(jiān)督學習
32使用k均值聚類算法對新聞數據集進行聚類
321k均值聚類算法是如何聚類的?
322從頭實現k均值聚類算法
323用機器學習實現k均值聚類算法
324k值的選擇
325使用k均值聚類新聞組數據
33在新聞組中發(fā)現基礎主題
34使用NMF進行主題建模
35使用LDA進行主題建模
本章小結
習題
第4章使用樸素貝葉斯檢測垃圾郵件
41從分類開始
411分類算法的類型
412文本分類的應用
42探索樸素貝葉斯
421通過案例來學習貝葉斯定理
422樸素貝葉斯的結構
423運用scratch庫實現樸素貝葉斯分類器
424運用scikit-learn庫實現樸素貝葉斯分類器
43分類性能評估
44模型調優(yōu)和交叉驗證
本章小結
習題
第5章使用支持向量機對新聞組主題進行分類
51用支持向量機尋找分離邊界
511通過不同的示例了解支持向量機如何工作
512實現支持向量機
513支持向量機的核心
514在線性核和RBF核之間進行選擇
52使用支持向量機對新聞組主題進行分類
53更多示例——心臟造影的胎兒狀態(tài)分類
54另一個示例——使用TensorFlow完成基于支持向量機的乳腺癌分類
本章小結
習題
第6章使用基于樹的算法預測在線廣告點擊率
61廣告點擊率預測概述
62兩種類型數據:數值型和分類型
63從根到葉探索決策樹
631構建決策樹
632衡量分裂的標準
64從頭實現決策樹
65用決策樹預測廣告點擊率
66集成決策樹——隨機森林
661使用TensorFlow實現隨機森林
本章小結
習題
第7章使用邏輯回歸預測在線廣告點擊率
71將分類特征轉換為數字特征——獨熱編碼和順序編碼
72用邏輯回歸對數據進行分類
721邏輯函數入門
722從邏輯函數到邏輯回歸
73訓練邏輯回歸模型
731利用梯度下降訓練邏輯回歸模型
732利用梯度下降的邏輯回歸模型預測在線廣告點擊率
733利用隨機梯度下降訓練邏輯回歸模型
734利用正則化訓練邏輯回歸模型
74通過在線學習訓練大型數據集
75處理多元分類
76使用TensorFlow實現邏輯回歸
77使用隨機森林進行特征選擇
本章小結
習題
第8章將預測擴展到TB級點擊日志
81學習Apache Spark的基本知識
811了解 Spark
812安裝Spark
813啟動和部署Spark程序
82在PySpark中編程
83使用Spark學習大量點擊日志
831加載點擊日志
832拆分和緩存數據
833對分類特征進行獨熱編碼
834訓練和測試邏輯回歸模型
84使用Spark對分類變量進行特征工程
841散列分類特征
842組合多個變量——特征交互
本章小結
習題
第9章使用回歸算法預測股票價格
91有關股票市場和股票價格的簡要概述
92什么是回歸
93獲取股價數據
931開始特征工程
932獲取數據并生成特征
94使用線性回歸來估計
941線性回歸是如何工作的
942實現線性回歸
95使用回歸樹進行預測
951從分類樹到回歸樹
952實現回歸樹
953實現隨機森林
96用支持向量回歸機進行評估
961實現支持向量回歸機
97用神經網絡進行估算
971揭開神經網絡的神秘面紗
972實現神經網絡
98評估回歸性能
99使用四種回歸算法預測股票價格
本章小結
習題
第3部分Python機器學習*佳案例
第10章機器學習*佳案例
101機器學習解決方案流程
102數據準備階段的*佳案例
1021*佳案例1——完全理解項目目標
1022*佳案例2——收集所有相關的特征
1023*佳案例3——保持特征值的一致性
1024*佳案例4——處理缺失數據
1025*佳案例5——存儲大規(guī)模數據
103訓練集生成階段的*佳案例
1031*佳案例6——區(qū)分分類型特征與數值型特征
1032*佳案例7——決定是否要對分類型特征進行編碼
1033*佳案例8——決定是否要選擇特征和如何選擇
1034*佳案例9——決定是否要降維和如何降維
1035*佳案例10——決定是否重新調整特征取值
1036*佳案例11——在擁有專業(yè)知識的條件下進行特征工程
1037*佳案例12——在缺少專業(yè)知識的條件下進行特征工程
1038*佳案例13——記錄每個特征是如何生成的
1039*佳案例14——從文本數據中提取特征
104模型訓練、評估和選擇階段的*佳案例
1041*佳案例15——選擇合適的起步算法
1042*佳案例16——減少過擬合
1043*佳案例17——識別過擬合與欠擬合
1044*佳案例18——在大型數據集上建模
105部署和監(jiān)視階段的*佳案例
1051*佳案例19——保存、加載和重用模型
1052*佳案例20——監(jiān)控模型性能
1053*佳案例21——定期更新模型
本章小結
習題
展開全部
書友推薦
- >
山海經
- >
回憶愛瑪儂
- >
名家?guī)阕x魯迅:朝花夕拾
- >
小考拉的故事-套裝共3冊
- >
隨園食單
- >
自卑與超越
- >
羅庸西南聯大授課錄
- >
大紅狗在馬戲團-大紅狗克里弗-助人
本類暢銷