中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
PythonPYTHON數據科學與機器學習:從入門到實踐

包郵 PythonPYTHON數據科學與機器學習:從入門到實踐

出版社:人民郵電出版社出版時間:2018-06-01
開本: 其他 頁數: 273
中 圖 價:¥50.7(7.3折) 定價  ¥69.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

PythonPYTHON數據科學與機器學習:從入門到實踐 版權信息

  • ISBN:9787115512413
  • 條形碼:9787115512413 ; 978-7-115-51241-3
  • 裝幀:一般膠版紙
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

PythonPYTHON數據科學與機器學習:從入門到實踐 本書特色

本書介紹了使用Python進行數據分析和高效的機器學習,首先從一節Python速成課開始,然后回顧統計學和概率論的基礎知識,接著深入討論與數據挖掘和機器學習相關的60多個主題,包括貝葉斯定理、聚類、決策樹、回歸分析、實驗設計等。

PythonPYTHON數據科學與機器學習:從入門到實踐 內容簡介

本書介紹了使用Python進行數據分析和高效的機器學習,首先從一節Python速成課開始,然后回顧統計學和概率論的基礎知識,接著深入討論與數據挖掘和機器學習相關的60多個主題,包括貝葉斯定理、聚類、決策樹、回歸分析、實驗設計等。

PythonPYTHON數據科學與機器學習:從入門到實踐 目錄

第 1 章 入門 1

1.1 安裝Enthought Canopy 1

1.2 使用并理解IPython/Jupyter Notebook 6

1.3 Python基礎——第 一部分 9

1.4 理解Python代碼 11

1.5 導入模塊 13

1.5.1 數據結構 13

1.5.2 使用列表 14

1.5.3 元組 17

1.5.4 字典 18

1.6 Python基礎——第二部分 20

1.6.1 Python中的函數 20

1.6.2 循環 23

1.6.3 探索活動 24

1.7 運行Python腳本 24

1.7.1 運行Python代碼的其他方式 25

1.7.2 在命令行中運行Python腳本 25

1.7.3 使用Canopy IDE 26

1.8 小結 28

第 2 章 統計與概率復習以及Python實現 29

2.1 數據類型 29

2.1.1 數值型數據 30

2.1.2 分類數據 30

2.1.3 定序數據 31

2.2 均值、中位數和眾數 32

2.2.1 均值 32

2.2.2 中位數 33

2.2.3 眾數 34

2.3 在Python中使用均值、中位數和眾數 35

2.3.1 使用NumPy包計算均值 35

2.3.2 使用NumPy包計算中位數 36

2.3.3 使用SciPy包計算眾數 37

2.4 標準差和方差 40

2.4.1 方差 40

2.4.2 標準差 42

2.4.3 總體方差與樣本方差 42

2.4.4 在直方圖上分析標準差和方差 44

2.4.5 使用Python計算標準差和方差 44

2.4.6 自己動手 45

2.5 概率密度函數和概率質量函數 45

2.5.1 概率密度函數 45

2.5.2 概率質量函數 46

2.6 各種類型的數據分布 47

2.6.1 均勻分布 47

2.6.2 正態分布或高斯分布 48

2.6.3 指數概率分布與指數定律 50

2.6.4 二項式概率質量函數 50

2.6.5 泊松概率質量函數 51

2.7 百分位數和矩 52

2.7.1 百分位數 53

2.7.2 矩 56

2.8 小結 60

第 3 章 Matplotlib與概率高級概念 61

3.1 Matplotlib快速學習 61

3.1.1 在一張圖形上進行多次繪圖 62

3.1.2 將圖形保存為文件 63

3.1.3 調整坐標軸 64

3.1.4 添加網格 65

3.1.5 修改線型和顏色 65

3.1.6 標記坐標軸并添加圖例 68

3.1.7 一個有趣的例子 69

3.1.8 生成餅圖 70

3.1.9 生成條形圖 71

3.1.10 生成散點圖 72

3.1.11 生成直方圖 72

3.1.12 生成箱線圖 73

3.1.13 自己動手 74

3.2 協方差與相關系數 74

3.2.1 概念定義 75

3.2.2 相關系數 76

3.2.3 在Python中計算協方差和相關系數 76

3.2.4 相關系數練習 80

3.3 條件概率 80

3.3.1 Python中的條件概率練習 81

3.3.2 條件概率作業 84

3.3.3 作業答案 85

3.4 貝葉斯定理 86

3.5 小結 88

第 4 章 預測模型 89

4.1 線性回歸 89

4.1.1 普通*小二乘法 90

4.1.2 梯度下降法 91

4.1.3 判定系數或r方 91

4.1.4 使用Python進行線性回歸并計算r方 92

4.1.5 線性回歸練習 94

4.2 多項式回歸 95

4.2.1 使用NumPy實現多項式回歸 96

4.2.2 計算r方誤差 98

4.2.3 多項式回歸練習 98

4.3 多元回歸和汽車價格預測 99

4.3.1 使用Python進行多元回歸 100

4.3.2 多元回歸練習 102

4.4 多水平模型 102

4.5 小結 104

第 5 章 使用Python進行機器學習 105

5.1 機器學習及訓練/測試法 105

5.1.1 非監督式學習 106

5.1.2 監督式學習 107

5.2 使用訓練/測試法防止多項式回歸中的過擬合 109

5.3 貝葉斯方法——概念 113

5.4 使用樸素貝葉斯實現垃圾郵件分類器 115

5.5 k均值聚類 118

5.6 基于收入與年齡進行人群聚類 121

5.7 熵的度量 123

5.8 決策樹——概念 124

5.8.1 決策樹實例 126

5.8.2 生成決策樹 127

5.8.3 隨機森林 127

5.9 決策樹——使用Python預測錄用決策 128

5.9.1 集成學習——使用隨機森林 132

5.9.2 練習 133

5.10 集成學習 133

5.11 支持向量機簡介 135

5.12 使用scikit-learn通過SVM進行人員聚集 137

5.13 小結 140

第 6 章 推薦系統 141

6.1 什么是推薦系統 141

6.2 基于項目的協同過濾 145

6.3 基于項目的協同過濾是如何工作的 146

6.4 找出電影相似度 149

6.5 改善電影相似度結果 155

6.6 向人們推薦電影 159

6.7 改善推薦結果 165

6.8 小結 167

第 7 章 更多數據挖掘和機器學習技術 168

7.1 k*近鄰的概念 168

7.2 使用KNN預測電影評分 170

7.3 數據降維與主成分分析 176

7.3.1 數據降維 176

7.3.2 主成分分析 177

7.4 對鳶尾花數據集的PCA示例 178

7.5 數據倉庫簡介 182

7.6 強化學習 184

7.6.1 Q-learning 185

7.6.2 探索問題 186

7.6.3 時髦名詞 186

7.7 小結 188

第 8 章 處理真實數據 189

8.1 偏差-方差權衡 189

8.2 使用k折交叉驗證避免過擬合 192

8.3 數據清理和標準化 196

8.4 清理Web日志數據 198

8.4.1 對Web日志應用正則表達式 198

8.4.2 修改1——篩選請求字段 200

8.4.3 修改2——篩選post請求 201

8.4.4 修改3——檢查用戶代理 203

8.4.5 篩選爬蟲與機器人 204

8.4.6 修改4——使用網站專用篩選器 205

8.4.7 Web日志數據練習 206

8.5 數值型數據的標準化 207

8.6 檢測異常值 208

8.6.1 處理異常值 209

8.6.2 異常值練習 211

8.7 小結211

第 9 章 Apache Spark——大數據上的機器學習 212

9.1 安裝Spark 212

9.1.1 在Windows系統中安裝Spark 213

9.1.2 在其他操作系統上安裝Spark 214

9.1.3 安裝Java Development Kit 214

9.1.4 安裝Spark 217

9.2 Spark簡介 227

9.2.1 可伸縮 227

9.2.2 速度快 228

9.2.3 充滿活力 229

9.2.4 易于使用 229

9.2.5 Spark組件 229

9.2.6 在Spark中使用Python還是Scala 230

9.3 Spark和彈性分布式數據集 231

9.3.1 SparkContext對象 231

9.3.2 創建RDD 232

9.3.3 更多創建RDD的方法 233

9.3.4 RDD操作 233

9.4 MLlib簡介 235

9.4.1 MLlib功能 235

9.4.2 MLlib特殊數據類型 236

9.5 在Spark中使用MLlib實現決策樹 236

9.6 在Spark中實現k均值聚類 245

9.7 TF-IDF 250

9.7.1 TF-IDF實戰 250

9.7.2 使用TF-IDF 251

9.8 使用Spark MLlib搜索維基百科 251

9.8.1 導入語句 252

9.8.2 創建初始RDD 252

9.8.3 創建并轉換HashingTF對象 253

9.8.4 計算TF-IDF得分 254

9.8.5 使用維基百科搜索引擎算法 254

9.8.6 運行算法 255

9.9 使用Spark 2.0中的MLlib數據框API 255

9.10 小結 259

第 10 章 測試與實驗設計 260

10.1 A/B測試的概念 260

10.1.1 A/B測試 260

10.1.2 A/B測試的轉化效果測量 262

10.1.3 小心方差 263

10.2 t檢驗與p值 263

10.2.1 t統計量或t檢驗 264

10.2.2 p值 264

10.3 使用Python計算t統計量和p值 265

10.3.1 使用實驗數據進行A/B測試 265

10.3.2 樣本量有關系嗎 267

10.4 確定實驗持續時間 268

10.5 A/B測試中的陷阱 269

10.5.1 新奇性效應 270

10.5.2 季節性效應 271

10.5.3 選擇性偏差 271

10.5.4 數據污染 272

10.5.5 歸因錯誤 272

10.6 小結 273

展開全部

PythonPYTHON數據科學與機器學習:從入門到實踐 作者簡介

Frank Kane,Sundog Software公司創始人,曾在Amazon和IMDb工作近9年,在分布式計算、數據挖掘和機器學習等領域持有17項專利。 【譯者簡介】 陳光欣,畢業于清華大學并留校工作,主要興趣為數據分析與數據挖掘。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 磁力反应釜,高压釜,实验室反应釜,高温高压反应釜-威海自控反应釜有限公司 | 康明斯发电机,上柴柴油发电机,玉柴柴油发电机组_海南重康电力官网 | 氧化锆纤维_1800度高温退火炉_1800度高温烧结炉-南京理工宇龙新材料股份有限公司 | 非标压力容器_碳钢储罐_不锈钢_搪玻璃反应釜厂家-山东首丰智能环保装备有限公司 | 筛分机|振动筛分机|气流筛分机|筛分机厂家-新乡市大汉振动机械有限公司 | 披萨石_披萨盘_电器家电隔热绵加工定制_佛山市南海区西樵南方综合保温材料厂 | 别墅图纸超市|别墅设计图纸|农村房屋设计图|农村自建房|别墅设计图纸及效果图大全 | 主题班会网 - 安全教育主题班会,各类主题班会PPT模板 | 环压强度试验机-拉链拉力试验机-上海倾技仪器仪表科技有限公司 | 知名电动蝶阀,电动球阀,气动蝶阀,气动球阀生产厂家|价格透明-【固菲阀门官网】 | 自动气象站_农业气象站_超声波气象站_防爆气象站-山东万象环境科技有限公司 | 胜为光纤光缆_光纤跳线_单模尾纤_光纤收发器_ODF光纤配线架厂家直销_北京睿创胜为科技有限公司 - 北京睿创胜为科技有限公司 | QQ房产导航-免费收录优秀房地产网站_房地产信息网 | 真丝围巾|真丝丝巾|羊绒围巾|围巾品牌|浙江越缇围巾厂家定制 | 万烁建筑设计院-建筑设计公司加盟,设计院加盟分公司,市政设计加盟 | 珠宝展柜-玻璃精品展柜-首饰珠宝展示柜定制-鸿钛展柜厂家 | [官网]叛逆孩子管教_戒网瘾学校_全封闭问题青少年素质教育_新起点青少年特训学校 | 网站建设-网站制作-网站设计-网站开发定制公司-网站SEO优化推广-咏熠软件 | 智慧钢琴-电钢琴-便携钢琴-数码钢琴-深圳市特伦斯乐器有限公司 | 高扬程排污泵_隔膜泵_磁力泵_节能自吸离心水泵厂家-【上海博洋】 | 水稻烘干机,小麦烘干机,大豆烘干机,玉米烘干机,粮食烘干机_巩义市锦华粮食烘干机械制造有限公司 水环真空泵厂家,2bv真空泵,2be真空泵-淄博真空设备厂 | 磁力反应釜,高压釜,实验室反应釜,高温高压反应釜-威海自控反应釜有限公司 | 污水处理设备维修_污水处理工程改造_机械格栅_过滤设备_气浮设备_刮吸泥机_污泥浓缩罐_污水处理设备_污水处理工程-北京龙泉新禹科技有限公司 | 高温高压釜(氢化反应釜)百科 | 517瓜水果特产网|一个专注特产好物的网站| 污水提升器,污水提升泵,地下室排水,增压泵,雨水泵,智能供排水控制器-上海智流泵业有限公司 | 化工ERP软件_化工新材料ERP系统_化工新材料MES软件_MES系统-广东顺景软件科技有限公司 | 工业铝型材-铝合金电机壳-铝排-气动执行器-山东永恒能源集团有限公司 | 对辊破碎机_四辊破碎机_双齿辊破碎机_华盛铭重工 | 变位机,焊接变位机,焊接变位器,小型变位机,小型焊接变位机-济南上弘机电设备有限公司 | 茶叶百科网-茶叶知识与茶文化探讨分享平台 | 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | 药品冷藏箱厂家_低温冰箱_洁净工作台-济南欧莱博电子商务有限公司官网 | 济南品牌包装设计公司_济南VI标志设计公司_山东锐尚文化传播 | 网站建设-网站制作-网站设计-网站开发定制公司-网站SEO优化推广-咏熠软件 | BOE画框屏-触摸一体机-触控查询一体机-触摸屏一体机价格-厂家直销-触发电子 | 飞扬动力官网-广告公司管理软件,广告公司管理系统,喷绘写真条幅制作管理软件,广告公司ERP系统 | 防渗膜厂家|养殖防渗膜|水产养殖防渗膜-泰安佳路通工程材料有限公司 | 二手注塑机回收_旧注塑机回收_二手注塑机买卖 - 大鑫二手注塑机 二手光谱仪维修-德国OBLF光谱仪|进口斯派克光谱仪-热电ARL光谱仪-意大利GNR光谱仪-永晖检测 | 中国产业发展研究网 - 提供行业研究报告 可行性研究报告 投资咨询 市场调研服务 | 消防设施操作员考试报名时间,报名入口,报考条件 |