-
>
闖進數學世界――探秘歷史名題
-
>
中醫基礎理論
-
>
當代中國政府與政治(新編21世紀公共管理系列教材)
-
>
高校軍事課教程
-
>
思想道德與法治(2021年版)
-
>
毛澤東思想和中國特色社會主義理論體系概論(2021年版)
-
>
中醫內科學·全國中醫藥行業高等教育“十四五”規劃教材
數據科學與大數據技術叢書Python機器學習原理與實踐/數據科學與大數據技術叢書 版權信息
- ISBN:9787300287317
- 條形碼:9787300287317 ; 978-7-300-28731-7
- 裝幀:一般膠版紙
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
數據科學與大數據技術叢書Python機器學習原理與實踐/數據科學與大數據技術叢書 內容簡介
本書引領讀者進入Python機器學習領域。理論上突出機器學習原理講解的可讀性并兼具知識深度和廣度,實踐上強調機器學習的可操作性并兼具應用廣泛性。本書不僅對原理進行了深入透徹的理論講解,而且通過Python編程給出了原理的直觀解釋以及可操作實現的應用案例。本書適合作為高等院校相關專業的機器學習教學用書,也可作為Python機器學習研究應用人員的參考用書。
數據科學與大數據技術叢書Python機器學習原理與實踐/數據科學與大數據技術叢書 目錄
第1章 機器學習與Python 概述
1.1 機器學習與人工智能1.1.1 符號主義人工智能
1.1.2 基于機器學習的人工智能
1.2 機器學習能做什么
1.2.1 機器學習的學習對象: 數據集
1.2.2 機器學習的任務
1.3 Python 實踐課: 初識Python
1.3.1 實踐一: Python 和Anaconda
1.3.2 實踐二: Python 第三方包的引用
1.3.3 實踐三: 學習Python 的NumPy 包
1.3.4 實踐四: 學習Python 的Pandas 包
1.3.5 實踐五: 學習Python 的Matplotlib 包
1.3.6 實踐六: 了解Python 的Scikit-learn 包
附錄
第2章 數據預測中的相關問題
2.1 數據預測與預測建模
2.1.1 預測模型
2.1.2 預測模型的幾何理解
2.1.3 預測模型參數估計的基本策略
2.2 預測模型的評價
2.2.1 模型誤差的評價指標
2.2.2 模型的圖形化評價工具
2.2.3 泛化誤差的估計方法
2.2.4 數據集的劃分策略
2.3 預測模型的選擇問題
2.3.1 幾個重要觀點
2.3.2 模型過擬合
2.3.3 預測模型的偏差和方差
2.4 Python 實踐課: 加深理論理解,探索應用實踐
2.4.1 實踐一: 預測模型中的一般線性回歸模型和Logistic 回歸模型
2.4.2 實踐二: 預測模型的評價指標和圖形化評價工具
2.4.3 實踐三: 不同復雜度模型下的訓練誤差和測試誤差
2.4.4 實踐四: 數據集劃分以及測試誤差估計
2.4.5 實踐五: 模型的過擬合以及偏差和方差
附錄
第3章 數據預測建模: 貝葉斯分類器
3.1 貝葉斯概率和貝葉斯法則
3.1.1 貝葉斯概率
3.1.2 貝葉斯法則
3.2 貝葉斯和樸素貝葉斯分類器
3.2.1 貝葉斯和樸素貝葉斯分類器的一般內容
3.2.2 貝葉斯分類器的先驗分布
3.3 貝葉斯分類器的分類邊界
3.4 Python 實踐課: 加深理論理解,探索應用實踐
3.4.1 實踐一: 探索不同參數下的貝塔分布特點
3.4.2 實踐二: 繪制貝葉斯分類器的分類邊界
3.4.3 實踐三: 二分類的空氣污染預測
3.4.4 實踐四: 多分類的文本分類預測
附錄
第4章 數據預測建模: 近鄰分析
4.1 近鄰分析: K-近鄰法
4.1.1 距離: K-近鄰法的近鄰度量
4.1.2 參數K: 1-近鄰法還是K-近鄰法
4.2 基于觀測相似性的加權K-近鄰法
4.2.1 加權K-近鄰法的權重
4.2.2 加權K-近鄰法的預測
4.2.3 加權K-近鄰法的分類邊界
4.3 K-近鄰法的適用性
4.4 Python 實踐課: 加深理論理解,探索應用實踐
4.4.1 實踐一: K-近鄰法不同參數K下的分類邊界
4.4.2 實踐二: 探討加權K-近鄰法中不同核函數的特點
4.4.3 實踐三: 加權K{近鄰法不同參數和加權策略下的分類邊界
4.4.4 實踐三: 空氣質量等級預測中的*優參數K
4.4.5 K-近鄰法的回歸預測問題
附錄
第5章 數據預測建模: 決策樹
5.1 決策樹的核心問題
5.1.1 什么是決策樹
5.1.2 分類樹的分類邊界
5.1.3 回歸樹的回歸平面
5.1.4 決策樹的生長和剪枝
5.2 分類回歸樹的生長
5.2.1 分類樹中的異質性度量
5.2.2 回歸樹中的異質性度量
5.3 分類回歸樹的剪枝
5.3.1 代價復雜度和*小代價復雜度
5.3.2 分類回歸樹的剪枝過程
5.4 Python 實踐課: 加深理論理解,探索應用實踐
5.4.1 實踐一: 回歸樹的回歸面
5.4.2 實踐二: 不同樹深度下分類樹的分類邊界
5.4.3 實踐三: 分類樹中的基尼系數和熵
5.4.4 實踐四: 空氣質量等級的分類預測
5.4.5 實踐五: 回歸樹和過擬合
附錄
第6章 數據預測建模: 集成學習
6.1 集成學習的一般問題
6.1.1 集成學習: 解決高方差問題
6.1.2 集成學習: 從弱模型到強模型
6.2 基于重抽樣自舉法的集成學習
6.2.1 重抽樣自舉法
6.2.2 袋裝策略
6.2.3 隨機森林
6.3 集成學習: 從弱模型到強模型
6.3.1 提升策略
6.3.2 AdaBoost.M1 算法
6.3.3 SAMME 算法和SAMME.R算法
6.3.4 回歸預測中的提升策略
6.4 梯度提升樹
6.4.1 梯度提升算法
6.4.2 梯度提升回歸樹
6.4.3 梯度提升分類樹
6.5 XGBoost 算法精要
6.5.1 XGBoost 算法中的目標函數
6.5.2 目標函數的近似表達
6.5.3 決策樹的求解
6.6 Python 實踐課: 加深理論理解,探索應用實踐
6.6.1 實踐一: 探討袋裝策略和隨機森林的方差
6.6.2 實踐二: 探討提升策略集成學習的預測效果
6.6.3 實踐三: 提升策略集成學習下高權重樣本觀測的變化
6.6.4 實踐四: 不同損失函數下AdaBoost 回歸預測
6.6.5 實踐五: 梯度提升算法和提升策略集成學習的對比
6.6.6 實踐六: 基于空氣質量監測數據, 對比集成學習的各種策略
附錄
第7章 數據預測建模:人工神經網絡
7.1 人工神經網絡的基本概念
7.1.1 網絡的基本構成
7.1.2 網絡節點的功能
7.2 感知機網絡
7.2.1 感知機網絡中的節點
7.2.2 感知機節點中的加法器
7.2.3 感知機節點中的激活函數
7.2.4 感知機的權重訓練
7.3 多層感知機及B-P 反向傳播算法
7.3.1 多層網絡的結構
7.3.2 多層網絡的隱藏節點
7.3.3 B-P 反向傳播算法
7.3.4 多層網絡的其他問題
7.4 Python 實踐課: 加深理論理解,探索應用實踐
7.4.1 實踐一: 探討二層感知機輸出節點不同激活函數的情況
7.4.2 實踐二: 利用模擬數據探討多層感知機網絡中隱藏節點的影響
7.4.3 實踐三: 基于手寫體郵政編碼點陣數據實現數字識別
7.4.4 實踐四: 基于空氣質量監測數據對PM2.5 的濃度進行預測
附錄
第8章 數據預測建模: 支持向量機
8.1 支持向量分類的一般問題
8.1.1 支持向量分類的基本思路
8.1.2 支持向量分類的三種情況
8.2 完全線性可分下的支持向量分類
8.2.1 如何求解超平面
8.2.2 參數求解的拉格朗日乘子法
8.2.3 支持向量分類的預測
8.3 廣義線性可分下的支持向量分類
8.3.1 廣義線性可分下的超平面
8.3.2 廣義線性可分下的錯誤懲罰和目標函數
8.3.3 廣義線性可分下的超平面參數求解
8.4 線性不可分問題下的支持向量分類
8.4.1 線性不可分問題的一般解決方式
8.4.2 支持向量分類克服維災難的途徑
8.5 支持向量回歸
8.5.1 支持向量回歸的基本思路
8.5.2 支持向量回歸的目標函數和約束條件
8.6 Python 實踐課: 加深理論理解,探索應用實踐
8.6.1 實踐一: 探討支持向量機分類的意義
8.6.2 實踐二: 探討完全線性可分下的支持向量分類
8.6.3 實踐三: 探討廣義線性可分下不同懲罰參數C 下的分類邊界
8.6.4 實踐四: 探討非線性可分下的空間變化思路
8.6.5 實踐五: 探討非線性可分下不同懲罰參數C 和核函數下的分類曲面
8.6.6 實踐六: 探討支持向量回歸中不同懲罰參數C 和??對回歸的影響
附錄
第9章 特征選擇: 過濾、包裹和嵌入策略
9.1 過濾式策略下的特征選擇
9.1.1 低方差過濾法
9.1.2 分類預測中的高相關過濾法:F 統計量
9.1.3 分類預測中的高相關過濾法:x2統計量
9.1.4 分類預測中的高相關過濾法:其他統計量
9.2 包裹式策略下的特征選擇
9.2.1 包裹式策略的基本思路
9.2.2 遞歸式特征剔除法
9.2.3 基于交叉驗證的遞歸式特征剔除法
9.3 嵌入式策略下的特征選擇
9.3.1 嶺回歸和Lasso 回歸
9.3.2 彈性網回歸
9.4 Python 實踐課: 加深理論理解,探索應用實踐
9.4.1 實踐一: 探討低方差過濾法的應用意義
9.4.2 實踐二: 探索高相關過濾法中的F 分布和卡方分布特點及應用
9.4.3 實踐三: 探索包裹式策略下的特征選擇及應用
9.4.4 實踐四: 探索Lasso 回歸中收縮參數ɑ變化對特征選擇的影響
9.4.5 實踐五: 探索彈性網回歸中不同L2 范數率變化對模型的影響
附錄
第10章 特征提取: 空間變換策略
10.1 主成分分析
10.1.1 主成分分析的基本出發點
10.1.2 主成分分析的基本原理
10.1.3 確定主成分
10.2 矩陣的奇異值分解
10.2.1 奇異值分解的基本思路
10.2.2 基于奇異值分解的特征提取
10.3 核主成分分析
10.3.1 核主成分分析的出發點
10.3.2 核主成分分析的基本原理
10.3.3 核主成分分析中的核函數
10.4 因子分析
10.4.1 因子分析的基本出發點
10.4.2 因子分析的基本原理
10.4.3 因子載荷矩陣的求解
10.4.4 因子得分的計算
10.4.5 因子分析的其他問題
10.5 Python 實踐課: 加深理論理解,探索應用實踐
10.5.1 實踐一: 探索主成分分析的基本原理和實踐
10.5.2 實踐二: 基于臉部點陣灰度數據,探索奇異值分解的應用
10.5.3 實踐三: 探索核主成分分析的意義和應用
10.5.4 實踐四: 探索因子分析的基本原理
10.5.5 實踐五: 基于空氣質量監測數據, 探索因子分析的應用
附錄
第11章 揭示數據內在結構:聚類分析
11.1 聚類分析的一般問題
11.1.1 聚類分析的目的
11.1.2 聚類算法概述
11.1.3 聚類解的評價
11.1.4 聚類解的可視化
11.2 基于質心的聚類模型: K-均值聚類
11.2.1 K-均值聚類基本過程
11.2.2 K-均值聚類中的聚類數目
11.2.3 基于K-均值聚類的預測
11.3 基于聯通性的聚類模型: 系統聚類
11.3.1 系統聚類的基本過程
11.3.2 系統聚類中距離的聯通性測度
11.3.3 系統聚類中的聚類數目
11.3.4 系統聚類中的其他問題
11.4 基于高斯分布的聚類模型:EM聚類
11.4.1 基于高斯分布聚類的出發點:有限混合分布
11.4.2 EM 聚類算法
11.5 Python 實踐課: 加深理論理解,探索實踐應用
11.5.1 實踐一: 探討K-值聚類特點和確定聚類數目K 的方法
11.5.2 實踐二: 探討系統聚類過程和可視化工具
11.5.3 實踐三: 探討聚類分析的實際應用
11.5.4 實踐四: 探討EM 聚類的適用場景和聚類實現
附錄
第12章 揭示數據內在結構: 特色聚類
12.1 基于密度的聚類: DBSCAN聚類
12.1.1 DBSCAN 聚類中的相關概念
12.1.2 DBSCAN 聚類過程
12.1.3 DBSCAN 聚類的參數敏感性
12.2 Mean-Shift 聚類
12.2.1 什么是核密度估計
12.2.2 核密度估計在Mean-Shift聚類中的意義
12.2.3 Mean-Shift 聚類過程
12.3 BIRCH 聚類
12.3.1 BIRCH 聚類的特點
12.3.2 BIRCH 算法中的聚類特征樹
12.3.3 BIRCH 聚類的核心步驟
12.3.4 BIRCH 聚類的在線動態聚類
12.3.5 BIRCH 聚類解的優化
12.4 Python 實踐課: 加深理論理解,探索應用實踐
12.4.1 探索DBSCAN 聚類算法的異形聚類特點以及參數敏感性
12.4.2 實現單變量的核密度估計,理解Mean-Shift 聚類算法
12.4.3 探討BIRCH 聚類的動態性特點
附錄
數據科學與大數據技術叢書Python機器學習原理與實踐/數據科學與大數據技術叢書 節選
本書在每章均設置了Python實踐課環節。一方面,通過Python程序代碼和可再現的各種圖形,幫助學習者理解抽象理論背后的直觀含義和方法精髓。另一方面,通過Python代碼,幫助學習者掌握和拓展機器學習的算法實現和應用實踐。同時,對程序中的關鍵點進行適度說明,并結合方法原理對程序運行結果進行解讀,對相關算法及其特點進行比較評述。全書所有模型和算法都有相應的Python程序,并提供全部代碼下載。
數據科學與大數據技術叢書Python機器學習原理與實踐/數據科學與大數據技術叢書 作者簡介
薛薇,中國人民大學統計學院副教授,中國人民大學應用統計科學研究中心研究員。所撰寫著作曾獲“十二五”普通高等教育本科國家級規劃教材、北京市高等教育精品教材。主要開設課程包括機器學習,統計分析軟件等。研究方向為機器學習與深度學習算法及應用研究。
- >
有舍有得是人生
- >
姑媽的寶刀
- >
自卑與超越
- >
上帝之肋:男人的真實旅程
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
【精裝繪本】畫給孩子的中國神話
- >
名家帶你讀魯迅:朝花夕拾
- >
推拿