中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
從零開始學Python數據分析與挖掘(第2版)

包郵 從零開始學Python數據分析與挖掘(第2版)

作者:劉順祥
出版社:清華大學出版社出版時間:2020-06-01
開本: 16開 頁數: 390
中 圖 價:¥55.3(6.9折) 定價  ¥79.8 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>
買過本商品的人還買了

從零開始學Python數據分析與挖掘(第2版) 版權信息

  • ISBN:9787302553052
  • 條形碼:9787302553052 ; 978-7-302-55305-2
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

從零開始學Python數據分析與挖掘(第2版) 本書特色

本書以Python 3.7版本作為數據分析與挖掘實戰的應用工具,從Python的基礎語法開始,陸續介紹有關數值計算的numpy、數據處理的pandas、數據可視化的matplotlib和數據挖掘的sklearn等內容。全書共涵蓋15種可視化圖形以及10個常用的數據挖掘算法和實戰項目,通過本書的學習,讀者可以掌握數據分析與挖掘的理論知識和實戰技能。 本書適于統計學、數學、經濟學、金融學、管理學以及相關理工科專業的本科生、研究生使用,也能夠提高從事數據咨詢、研究或分析等人士的專業水平和技能。

從零開始學Python數據分析與挖掘(第2版) 內容簡介

為滿足用人單位對數據分析和挖掘人員在編程方面的技能要求,本書遵循由淺入深的原則,詳細地介紹了利用Python及其相關工具實現數據分析和挖掘的實用技能。
結合Python中成熟的Numpy、Pandas、MatPlotLib、Sklearn、Seaborn、Statsmodels和SciPy模塊,實現數據分析與挖掘中關于數據的清洗、整理、探索、可視化、建模和評估等流程的操作,讓每一位對數據分析和挖掘的從業者或感興趣的讀者都能從中學到所需的內容。
詳解十大常用數據挖掘算法及案例實戰,如多元線性回歸的預測模型、決策樹分類模型、SVM分類模型、GBDT分類模型、K均值聚類模型等,基本覆蓋用人單位對常用挖掘算法的需求。

從零開始學Python數據分析與挖掘(第2版) 目錄

目 錄
第1章 數據分析與挖掘概述 1
1.1 什么是數據分析和挖掘 1
1.2 數據分析與挖掘的應用領域 2
1.2.1 電商領域——發現破壞規則的“害群之馬” 2
1.2.2 交通出行領域——為打車平臺進行私人訂制 3
1.2.3 醫療健康領域——找到*佳醫療方案 3
1.3 數據分析與挖掘的區別 4
1.4 數據挖掘的流程 5
1.4.1 明確目標 5
1.4.2 數據搜集 6
1.4.3 數據清洗 6
1.4.4 構建模型 7
1.4.5 模型評估 7
1.4.6 應用部署 7
1.5 常用的數據分析與挖掘工具 8
1.6 本章小結 9
1.7 課后練習 9
第2章 從收入的預測分析開始 10
2.1 下載與安裝Anaconda 10
2.1.1 基于Windows系統安裝 11
2.1.2 基于Mac系統安裝 12
2.1.3 基于Linux系統安裝 14
2.2 基于Python的案例實戰 14
2.2.1 數據的預處理 14
2.2.2 數據的探索性分析 16
2.2.3 數據建模 19
2.3 本章小結 29
2.4 課后練習 29
第3章 Python基礎與數據抓取 30
3.1 數據結構及方法 30
3.1.1 列表 30
3.1.2 元組 36
3.1.3 字典 36
3.2 控制流 40
3.2.1 if分支 40
3.2.2 for循環 41
3.2.3 while循環 43
3.3 字符串處理方法 45
3.3.1 字符串的常用方法 45
3.3.2 正則表達式 47
3.4 自定義函數 50
3.4.1 自定義函數語法 50
3.4.2 自定義函數的幾種參數 52
3.5 一個爬蟲案例 55
3.6 本章小結 57
3.7 課后練習 59
第4章 Python數值計算——numpy的高效技能 60
4.1 數組的創建與操作 60
4.1.1 數組的創建 60
4.1.2 數組元素的獲取 61
4.1.3 數組的常用屬性 63
4.1.4 數組的形狀處理 64
4.2 數組的基本運算符 67
4.2.1 四則運算 67
4.2.2 比較運算 68
4.2.3 廣播運算 70
4.3 常用的數學和統計函數 71
4.4 線性代數的相關計算 73
4.4.1 矩陣乘法 73
4.4.2 diag函數的使用 74
4.4.3 特征根與特征向量 75
4.4.4 多元線性回歸模型的解 75
4.4.5 多元一次方程組的求解 76
4.4.6 范數的計算 76
4.5 偽隨機數的生成 77
4.6 本章小結 80
4.7 課后練習 81
第5章 Python數據處理——展現pandas的強大 82
5.1 序列與數據框的構造 82
5.1.1 構造序列 83
5.1.2 構造數據框 85
5.2 外部數據的讀取 86
5.2.1 文本文件的讀取 86
5.2.2 電子表格的讀取 88
5.2.3 數據庫數據的讀取 89
5.3 數據類型轉換及描述統計 91
5.4 字符與日期數據的處理 95
5.5 常用的數據清洗方法 99
5.5.1 重復觀測處理 99
5.5.2 缺失值處理 100
5.5.3 異常值處理 103
5.6 數據子集的獲取 106
5.7 透視表功能 108
5.8 表之間的合并與連接 111
5.9 分組聚合操作 114
5.10 本章小結 116
5.11 課后練習 118
第6章 Python數據可視化——分析報告必要元素 119
6.1 離散型變量的可視化 119
6.1.1 餅圖——“芝麻信用”失信用戶分布 120
6.1.2 條形圖——胡潤排行榜 124
6.2 數值型變量的可視化 134
6.2.1 直方圖與核密度曲線——展現年齡分布特征 134
6.2.2 箱線圖——二手房單價分布形態 138
6.2.3 小提琴圖——客戶消費數據的呈現 142
6.2.4 折線圖——公眾號每日閱讀趨勢 144
6.3 關系型數據的可視化 149
6.3.1 散點圖——探究鳶尾花花瓣長度與寬度的關系 149
6.3.2 氣泡圖——暴露商品的銷售特征 153
6.3.3 熱力圖——一份簡單的月度日歷 154
6.4 多個圖形的合并 157
6.5 本章小結 160
6.6 課后練習 161
第7章 線性回歸預測模型 163
7.1 一元線性回歸模型——收入預測 163
7.2 多元線性回歸模型——銷售利潤預測 167
7.2.1 回歸模型的參數求解 167
7.2.2 回歸模型的預測 168
7.3 回歸模型的假設檢驗 171
7.3.1 模型的顯著性檢驗——F檢驗 171
7.3.2 回歸系數的顯著性檢驗——t檢驗 174
7.4 回歸模型的診斷 175
7.4.1 正態性檢驗 176
7.4.2 多重共線性檢驗 178
7.4.3 線性相關性檢驗 179
7.4.4 異常值檢驗 181
7.4.5 獨立性檢驗 184
7.4.6 方差齊性檢驗 184
7.5 本章小結 187
7.6 課后練習 188
第8章 嶺回歸與LASSO回歸模型 189
8.1 嶺回歸模型 189
8.1.1 參數求解 190
8.1.2 系數求解的幾何意義 191
8.2 嶺回歸模型的應用——糖尿病病情預測(1) 192
8.2.1 可視化方法確定λ值 192
8.2.2 交叉驗證法確定λ值 194
8.2.3 模型的預測 196
8.3 LASSO回歸模型——糖尿病病情預測(2) 197
8.3.1 參數求解 197
8.3.2 系數求解的幾何意義 199
8.4 LASSO回歸模型的應用 200
8.4.1 可視化方法確定λ值 200
8.4.2 交叉驗證法確定λ值 201
8.4.3 模型的預測 202
8.5 本章小結 204
8.6 課后練習 205
第9章 Logistic回歸分類模型 206
9.1 Logistic模型的構建 207
9.1.1 Logistic模型的參數求解 209
9.1.2 Logistic模型的參數解釋 211
9.2 分類模型的評估方法 211
9.2.1 混淆矩陣 212
9.2.2 ROC曲線 213
9.2.3 K-S曲線 214
9.3 Logistic回歸模型的應用——運動狀態的識別 217
9.3.1 模型的構建 217
9.3.2 模型的預測 219
9.3.3 模型的評估 219
9.4 本章小結 223
9.5 課后練習 224
第10章 決策樹與隨機森林 225
10.1 節點字段的選擇 226
10.1.1 信息增益 227
10.1.2 信息增益率 229
10.1.3 基尼指數 230
10.2 決策樹的剪枝 233
10.2.1 誤差降低剪枝法 234
10.2.2 悲觀剪枝法 234
10.2.3 代價復雜度剪枝法 236
10.3 隨機森林 237
10.4 決策樹與隨機森林的應用——腎病患者病情預測 239
10.4.1 分類問題的解決 239
10.4.2 預測問題的解決 246
10.5 本章小結 249
10.6 課后練習 250
第11章 KNN模型及應用 251
11.1 KNN算法的思想 251
11.2 *佳k值的選擇 252
11.3 相似度的度量方法 253
11.3.1 歐式距離 253
11.3.2 曼哈頓距離 254
11.3.3 余弦相似度 254
11.3.4 杰卡德相似系數 255
11.4 近鄰樣本的搜尋方法 255
11.4.1 KD樹搜尋法 256
11.4.2 球樹搜尋法 259
11.5 KNN模型的應用——高爐發電量的預測 260
11.5.1 分類問題的解決 261
11.5.2 預測問題的解決 265
11.6 本章小結 269
11.7 課后練習 270
第12章 樸素貝葉斯模型 271
12.1 樸素貝葉斯理論基礎 272
12.2 幾種貝葉斯模型 273
12.2.1 高斯貝葉斯分類器 273
12.2.2 高斯貝葉斯分類器的應用——面部皮膚的判別 275
12.2.3 多項式貝葉斯分類器 278
12.2.4 多項式貝葉斯分類器的應用——蘑菇毒性的預判 280
12.2.5 伯努利貝葉斯分類器 283
12.2.6 伯努利貝葉斯分類器的應用——評論的情感識別 285
12.3 本章小結 289
12.4 課后練習 290
第13章 SVM模型及應用 292
13.1 SVM簡介 293
13.1.1 距離公式的介紹 293
13.1.2 SVM的實現思想 294
13.2 幾種常見的SVM模型 295
13.2.1 線性可分的SVM 295
13.2.2 一個手動計算的案例 298
13.2.3 近似線性可分SVM 300
13.2.4 非線性可分SVM 303
13.2.5 幾種常用的SVM核函數 304
13.2.6 SVM的回歸預測 306
13.3 分類問題的解決——手寫字母的識別 308
13.4 預測問題的解決——受災面積的預測 310
13.5 本章小結 314
13.6 課后練習 315
第14章 GBDT模型及應用 316
14.1 提升樹算法 317
14.1.1 AdaBoost算法的損失函數 317
14.1.2 AdaBoost算法的操作步驟 319
14.1.3 AdaBoost算法的簡單例子 320
14.1.4 AdaBoost算法的應用——違約客戶的識別 322
14.2 梯度提升樹算法 328
14.2.1 GBDT算法的操作步驟 328
14.2.2 GBDT分類算法 329
14.2.3 GBDT回歸算法 330
14.2.4 GBDT算法的應用——欺詐交易的識別 331
14.3 非平衡數據的處理 334
14.4 XGBoost算法 336
14.4.1 XGBoost算法的損失函數 336
14.4.2 損失函數的演變 337
14.4.3 XGBoost算法的應用 340
14.5 本章小結 346
14.6 課后練習 347
第15章 Kmeans聚類分析 349
15.1 Kmeans聚類 350
15.1.1 Kmeans的思想 350
15.1.2 Kmeans的原理 351
15.2 *佳k值的確定 352
15.2.1 拐點法 352
15.2.2 輪廓系數法 355
15.2.3 間隔統計量法 357
15.3 Kmeans聚類的應用 359
15.3.1 鳶尾花類別的聚合 360
15.3.2 基于NBA球員歷史參賽數據的聚類 363
15.4 Kmeans聚類的注意事項 367
15.5 本章小結 367
15.6 課后練習 368
第16章 DBSCAN與層次聚類分析 369
16.1 密度聚類簡介 370
16.1.1 密度聚類相關的概念 370
16.1.2 密度聚類的步驟 371
16.2 密度聚類與Kmeans的比較 373
16.3 層次聚類 376
16.3.1 簇間的距離度量 377
16.3.2 層次聚類的步驟 378
16.3.3 三種層次聚類的比較 380
16.4 密度聚類與層次聚類的應用——基于各省出生率與死亡率的聚類 382
16.5 本章小結 388
16.6 課后練習 390
展開全部

從零開始學Python數據分析與挖掘(第2版) 作者簡介

劉順祥,統計學碩士,“數據分析1480”微信公眾號運營者。曾就職于大數據咨詢公司,為聯想、亨氏、美麗田園、網魚網咖等企業項目提供服務;曾在唯品會大數據部擔任數據分析師一職,負責電商支付環節的數據分析業務。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: 细砂提取机,隔膜板框泥浆污泥压滤机,螺旋洗砂机设备,轮式洗砂机械,机制砂,圆锥颚式反击式破碎机,振动筛,滚筒筛,喂料机- 上海重睿环保设备有限公司 | 奇酷教育-Python培训|UI培训|WEB大前端培训|Unity3D培训|HTML5培训|人工智能培训|JAVA开发的教育品牌 | 深圳高新投三江工业消防解决方案提供厂家_服务商_园区智慧消防_储能消防解决方案服务商_高新投三江 | loft装修,上海嘉定酒店式公寓装修公司—曼城装饰 | 黄石妇科医院_黄石东方女子医院_黄石东方妇产医院怎么样 | 联系我们-腾龙公司上分客服微信19116098882 | 电磁辐射仪-电磁辐射检测仪-pm2.5检测仪-多功能射线检测仪-上海何亦仪器仪表有限公司 | 济南展厅设计施工_数字化展厅策划设计施工公司_山东锐尚文化传播有限公司 | 民用音响-拉杆音响-家用音响-ktv专用音响-万昌科技 | 阜阳成人高考_阜阳成考报名时间_安徽省成人高考网 | 杭州画室_十大画室_白墙画室_杭州美术培训_国美附中培训_附中考前培训_升学率高的画室_美术中考集训美术高考集训基地 | 耐酸碱泵-自吸耐酸碱泵型号「品牌厂家」立式耐酸碱泵价格-昆山国宝过滤机有限公司首页 | 自动售货机_无人售货机_专业的自动售货机运营商_免费投放售货机-广州富宏主官网 | 智成电子深圳tdk一级代理-提供TDK电容电感贴片蜂鸣器磁芯lambda电源代理经销,TDK代理商有哪些TDK一级代理商排名查询。-深圳tdk一级代理 | 耐火砖厂家,异形耐火砖-山东瑞耐耐火材料厂 | 丹尼克尔拧紧枪_自动送钉机_智能电批_柔性振动盘_螺丝供料器品牌 | 真空泵维修保养,普发,阿尔卡特,荏原,卡西亚玛,莱宝,爱德华干式螺杆真空泵维修-东莞比其尔真空机电设备有限公司 | 电动垃圾车,垃圾清运车-江苏速利达机车有限公司 | 岩棉切条机厂家_玻璃棉裁条机_水泥基保温板设备-廊坊鹏恒机械 | 低浓度恒温恒湿称量系统,强光光照培养箱-上海三腾仪器有限公司 | LNG鹤管_内浮盘价格,上装鹤管,装车撬厂家-连云港赛威特机械 | 锂电池砂磨机|石墨烯砂磨机|碳纳米管砂磨机-常州市奥能达机械设备有限公司 | 天长市晶耀仪表有限公司| 加热制冷恒温循环器-加热制冷循环油浴-杭州庚雨仪器有限公司 | 无锡网站建设_企业网站定制-网站制作公司-阿凡达网络 | 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 上海道勤塑化有限公司 | 佛山市德信昌电子有限公司| 深圳品牌设计公司-LOGO设计公司-VI设计公司-未壳创意 | 上海平衡机-单面卧式动平衡机-万向节动平衡机-圈带动平衡机厂家-上海申岢动平衡机制造有限公司 | 一体化污水处理设备_生活污水处理设备_全自动加药装置厂家-明基环保 | 皮带式输送机械|链板式输送机|不锈钢输送机|网带输送机械设备——青岛鸿儒机械有限公司 | 广州展览设计公司_展台设计搭建_展位设计装修公司-众派展览装饰 广州展览制作工厂—[优简]直营展台制作工厂_展会搭建资质齐全 | 东莞猎头公司_深圳猎头公司_广州猎头公司-广东万诚猎头提供企业中高端人才招聘服务 | 桁架楼承板-钢筋桁架楼承板-江苏众力达钢筋楼承板厂 | 不锈钢复合板|钛复合板|金属复合板|南钢集团安徽金元素复合材料有限公司-官网 | 齿轮减速机电机一体机_齿轮减速箱加电机一体化-德国BOSERL蜗轮蜗杆减速机电机生产厂家 | 食品机械专用传感器-落料放大器-低价接近开关-菲德自控技术(天津)有限公司 | 体检车_移动CT车_CT检查车_CT车_深圳市艾克瑞电气有限公司移动CT体检车厂家-深圳市艾克瑞电气有限公司 | 拖链电缆_柔性电缆_伺服电缆_坦克链电缆-深圳市顺电工业电缆有限公司 | FAG轴承,苏州FAG轴承,德国FAG轴承-恩梯必传动设备(苏州)有限公司 |