中图网(原中国图书网):网上书店,中文字幕在线一区二区三区,尾货特色书店,中文字幕在线一区,30万种特价书低至2折!

歡迎光臨中圖網 請 | 注冊
> >
從零開始學Python數據分析與挖掘

包郵 從零開始學Python數據分析與挖掘

作者:劉順祥
出版社:清華大學出版社出版時間:2018-10-01
開本: 16開 頁數: 366
中 圖 價:¥38.1(4.8折) 定價  ¥79.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
溫馨提示:5折以下圖書主要為出版社尾貨,大部分為全新(有塑封/無塑封),個別圖書品相8-9成新、切口
有劃線標記、光盤等附件不全詳細品相說明>>
本類五星書更多>

從零開始學Python數據分析與挖掘 版權信息

從零開始學Python數據分析與挖掘 本書特色

快速上手,輕松圓夢Python數據分析師 為滿足用人單位對數據分析和挖掘人員在編程方面的技能要求,本書遵循由淺入深的原則,詳細地介紹了利用Python及其相關工具實現數據分析和挖掘的實用技能。 結合Python中成熟的Numpy、Pandas、MatPlotLib、Sklearn、Seaborn、Statsmodels和SciPy模塊,實現數據分析與挖掘中關于數據的清洗、整理、探索、可視化、建模和評估等流程的操作,讓每一位對數據分析或挖掘的從業者或感興趣的讀者都能從中學到所需的內容。 十大常用數據挖掘算法及實戰案例,如多元線性回歸的預測模型、決策樹分類模型、SVM分類模型、GBDT分類模型、K均值聚類模型等,基本覆蓋用人單位對常用挖掘算法的需求。

從零開始學Python數據分析與挖掘 內容簡介

本書以Python 3版本作為數據分析與挖掘實戰的應用工具,從Pyhton的基礎語法開始,陸續介紹有關數值計算的Numpy、數據處理的Pandas、數據可視化的Matplotlib和數據挖掘的Sklearn等內容。全書共涵蓋15種可視化圖形以及10個常用的數據挖掘算法和實戰項目,通過本書的學習,讀者可以掌握數據分析與挖掘的理論知識和實戰技能。 本書適于統計學、數學、經濟學、金融學、管理學以及相關理工科專業的本科生、研究生使用,也能夠提高從事數據咨詢、研究或分析等人士的專業水平和技能。

從零開始學Python數據分析與挖掘 目錄

目 錄
第1章 數據分析與挖掘概述 1
1.1 什么是數據分析和挖掘 1
1.2 數據分析與挖掘的應用領域 2
1.2.1 電商領域——發現破壞規則的“害群之馬” 2
1.2.2 交通出行領域——為打車平臺進行私人訂制 3
1.2.3 醫療健康領域——找到*佳醫療方案 3
1.3 數據分析與挖掘的區別 4
1.4 數據挖掘的流程 5
1.4.1 明確目標 5
1.4.2 數據搜集 6
1.4.3 數據清洗 6
1.4.4 構建模型 7
1.4.5 模型評估 7
1.4.6 應用部署 8
1.5 常用的數據分析與挖掘工具 8
1.6 本章小結 9
第2章 從收入的預測分析開始 10
2.1 下載與安裝Anoconda 10
2.1.1 基于Windows系統安裝 11
2.1.2 基于Mac系統安裝 12
2.1.3 基于Linux系統安裝 14
2.2 基于Python的案例實戰 14
2.2.1 數據的預處理 14
2.2.2 數據的探索性分析 16
2.2.3 數據建模 19
2.3 本章小結 28
第3章 Python快速入門 29
3.1 數據結構及方法 29
3.1.1 列表 29
3.1.2 元組 34
3.1.3 字典 35
3.2 控制流 38
3.2.1 if分支 38
3.2.2 for循環 39
3.2.3 while循環 41
3.3 字符串處理方法 43
3.3.1 字符串的常用方法 43
3.3.2 正則表達式 45
3.4 自定義函數 47
3.4.1 自定義函數語法 47
3.4.2 自定義函數的幾種參數 49
3.5 一個爬蟲案例 52
3.6 本章小結 54
第4章 Python數值計算工具——Numpy 56
4.1 數組的創建與操作 56
4.1.1 數組的創建 56
4.1.2 數組元素的獲取 57
4.1.3 數組的常用屬性 58
4.1.4 數組的形狀處理 59
4.2 數組的基本運算符 62
4.2.1 四則運算 62
4.2.2 比較運算 63
4.2.3 廣播運算 65
4.3 常用的數學和統計函數 66
4.4 線性代數的相關計算 67
4.4.1 矩陣乘法 68
4.4.2 diag函數的使用 69
4.4.3 特征根與特征向量 69
4.4.4 多元線性回歸模型的解 70
4.4.5 多元一次方程組的求解 70
4.4.6 范數的計算 71
4.5 偽隨機數的生成 71
4.6 本章小結 74
第5章 Python數據處理工具——Pandas 76
5.1 序列與數據框的構造 76
5.1.1 構造序列 77
5.1.2 構造數據框 78
5.2 外部數據的讀取 79
5.2.1 文本文件的讀取 79
5.2.2 電子表格的讀取 81
5.2.3 數據庫數據的讀取 83
5.3 數據類型轉換及描述統計 85
5.4 字符與日期數據的處理 89
5.5 常用的數據清洗方法 93
5.5.1 重復觀測處理 93
5.5.2 缺失值處理 94
5.5.3 異常值處理 97
5.6 數據子集的獲取 99
5.7 透視表功能 101
5.8 表之間的合并與連接 104
5.9 分組聚合操作 107
5.10 本章小結 108
第6章 Python數據可視化 110
6.1 離散型變量的可視化 110
6.1.1 餅圖 110
6.1.2 條形圖 115
6.2 數值型變量的可視化 125
6.2.1 直方圖與核密度曲線 125
6.2.2 箱線圖 129
6.2.3 小提琴圖 133
6.2.4 折線圖 135
6.3 關系型數據的可視化 139
6.3.1 散點圖 139
6.3.2 氣泡圖 142
6.3.3 熱力圖 144
6.4 多個圖形的合并 146
6.5 本章小結 148
第7章 線性回歸預測模型 150
7.1 一元線性回歸模型 150
7.2 多元線性回歸模型 153
7.2.1 回歸模型的參數求解 154
7.2.2 回歸模型的預測 155
7.3 回歸模型的假設檢驗 157
7.3.1 模型的顯著性檢驗——F檢驗 158
7.3.2 回歸系數的顯著性檢驗——t檢驗 160
7.4 回歸模型的診斷 162
7.4.1 正態性檢驗 162
7.4.2 多重共線性檢驗 164
7.4.3 線性相關性檢驗 165
7.4.4 異常值檢驗 167
7.4.5 獨立性檢驗 170
7.4.6 方差齊性檢驗 170
7.5 本章小結 173
第8章 嶺回歸與LASSO回歸模型 174
8.1 嶺回歸模型 174
8.1.1 參數求解 175
8.1.2 系數求解的幾何意義 176
8.2 嶺回歸模型的應用 177
8.2.1 可視化方法確定?值 177
8.2.2 交叉驗證法確定?值 179
8.2.3 模型的預測 180
8.3 LASSO回歸模型 182
8.3.1 參數求解 182
8.3.2 系數求解的幾何意義 183
8.4 LASSO回歸模型的應用 184
8.4.1 可視化方法確定?值 184
8.4.2 交叉驗證法確定?值 186
8.4.3 模型的預測 187
8.5 本章小結 189
第9章 Logistic回歸分類模型 190
9.1 Logistic模型的構建 191
9.1.1 Logistic模型的參數求解 193
9.1.2 Logistic模型的參數解釋 195
9.2 分類模型的評估方法 195
9.2.1 混淆矩陣 196
9.2.2 ROC曲線 197
9.2.3 K-S曲線 198
9.3 Logistic回歸模型的應用 200
9.3.1 模型的構建 200
9.3.2 模型的預測 202
9.3.3 模型的評估 203
9.4 本章小結 207
第10章 決策樹與隨機森林 208
10.1 節點字段的選擇 209
10.1.1 信息增益 210
10.1.2 信息增益率 212
10.1.3 基尼指數 213
10.2 決策樹的剪枝 216
10.2.1 誤差降低剪枝法 217
10.2.2 悲觀剪枝法 217
10.2.3 代價復雜度剪枝法 219
10.3 隨機森林 220
10.4 決策樹與隨機森林的應用 222
10.4.1 分類問題的解決 222
10.4.2 預測問題的解決 229
10.5 本章小結 231

第11章 KNN模型的應用 233
11.1 KNN算法的思想 233
11.2 *佳k值的選擇 234
11.3 相似度的度量方法 235
11.3.1 歐式距離 235
11.3.2 曼哈頓距離 236
11.3.3 余弦相似度 236
11.3.4 杰卡德相似系數 237
11.4 近鄰樣本的搜尋方法 238
11.4.1 KD樹搜尋法 238
11.4.2 球樹搜尋法 242
11.5 KNN模型的應用 244
11.5.1 分類問題的解決 245
11.5.2 預測問題的解決 248
11.6 本章小結 251
第12章 樸素貝葉斯模型 253
12.1 樸素貝葉斯理論基礎 253
12.2 幾種貝葉斯模型 255
12.2.1 高斯貝葉斯分類器 255
12.2.2 高斯貝葉斯分類器的應用 257
12.2.3 多項式貝葉斯分類器 259
12.2.4 多項式貝葉斯分類器的應用 261
12.2.5 伯努利貝葉斯分類器 264
12.2.6 伯努利貝葉斯分類器的應用 266
12.3 本章小結 271
第13章 SVM模型的應用 272
13.1 SVM簡介 273
13.1.1 距離公式的介紹 273
13.1.2 SVM的實現思想 274
13.2 幾種常見的SVM模型 276
13.2.1 線性可分的SVM 276
13.2.2 一個手動計算的案例 279
13.2.3 近似線性可分SVM 281
13.2.4 非線性可分SVM 284
13.2.5 幾種常用的SVM核函數 285
13.2.6 SVM的回歸預測 287
13.3 分類問題的解決 289
13.4 預測問題的解決 291
13.5 本章小結 294

第14章 GBDT模型的應用 296
14.1 提升樹算法 297
14.1.1 AdaBoost算法的損失函數 297
14.1.2 AdaBoost算法的操作步驟 299
14.1.3 AdaBoost算法的簡單例子 300
14.1.4 AdaBoost算法的應用 302
14.2 梯度提升樹算法 308
14.2.1 GBDT算法的操作步驟 308
14.2.2 GBDT分類算法 309
14.2.3 GBDT回歸算法 309
14.2.4 GBDT算法的應用 310
14.3 非平衡數據的處理 313
14.4 XGBoost算法 315
14.4.1 XGBoost算法的損失函數 315
14.4.2 損失函數的演變 317
14.4.3 XGBoost算法的應用 319
14.5 本章小結 324
第15章 Kmeans聚類分析 326
15.1 Kmeans聚類 327
15.1.1 Kmeans的思想 327
15.1.2 Kmeans的原理 328
15.2 *佳k值的確定 329
15.2.1 拐點法 329
15.2.2 輪廓系數法 332
15.2.3 間隔統計量法 333
15.3 Kmeans聚類的應用 336
15.3.1 iris數據集的聚類 336
15.3.2 NBA球員數據集的聚類 339
15.4 Kmeans聚類的注意事項 343
15.5 本章小結 343
第16章 DBSCAN與層次聚類分析 345
16.1 密度聚類簡介 345
16.1.1 密度聚類相關的概念 346
16.1.2 密度聚類的步驟 347
16.2 密度聚類與Kmeans的比較 349
16.3 層次聚類 353
16.3.1 簇間的距離度量 354
16.3.2 層次聚類的步驟 356
16.3.3 三種層次聚類的比較 357
16.4 密度聚類與層次聚類的應用 359
16.5 本章小結 365


展開全部

從零開始學Python數據分析與挖掘 作者簡介

劉順祥, 統計學碩士,“數據分析1480”微信公眾號運營者。曾就職于大數據咨詢公司,為聯想、亨氏、美麗田園、網魚網咖等企業項目提供服務;曾在唯品會大數據部擔任數據分析師一職,負責電商支付環節的數據分析業務。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服
主站蜘蛛池模板: DDoS安全防护官网-领先的DDoS安全防护服务商 | 净化车间_洁净厂房_净化公司_净化厂房_无尘室工程_洁净工程装修|改造|施工-深圳净化公司 | 专注氟塑料泵_衬氟泵_磁力泵_卧龙泵阀_化工泵专业品牌 - 梭川泵阀 | 中国品牌门窗网_中国十大门窗品牌_著名门窗品牌 | 裹包机|裹膜机|缠膜机|绕膜机-上海晏陵智能设备有限公司 | PC构件-PC预制构件-构件设计-建筑预制构件-PC构件厂-锦萧新材料科技(浙江)股份有限公司 | 酒店品牌设计-酒店vi设计-酒店标识设计【国际级】VI策划公司 | 船用泵,船用离心泵,船用喷射泵,泰州隆华船舶设备有限公司 | 连续油炸机,全自动油炸机,花生米油炸机-烟台茂源食品机械制造有限公司 | 车间除尘设备,VOCs废气处理,工业涂装流水线,伸缩式喷漆房,自动喷砂房,沸石转轮浓缩吸附,机器人喷粉线-山东创杰智慧 | 山东PE给水管厂家,山东双壁波纹管,山东钢带增强波纹管,山东PE穿线管,山东PE农田灌溉管,山东MPP电力保护套管-山东德诺塑业有限公司 | 储气罐,真空罐,缓冲罐,隔膜气压罐厂家批发价格,空压机储气罐规格型号-上海申容压力容器集团有限公司 | 北京中创汇安科贸有限公司 | 陕西华春网络科技股份有限公司| 钢格板_钢格栅_格栅板_钢格栅板 - 安平县鑫拓钢格栅板厂家 | 旋片真空泵_真空泵_水环真空泵_真空机组-深圳恒才机电设备有限公司 | 钢制暖气片散热器_天津钢制暖气片_卡麦罗散热器厂家 | 北京网站建设首页,做网站选【优站网】,专注北京网站建设,北京网站推广,天津网站建设,天津网站推广,小程序,手机APP的开发。 | 背压阀|减压器|不锈钢减压器|减压阀|卫生级背压阀|单向阀|背压阀厂家-上海沃原自控阀门有限公司 本安接线盒-本安电路用接线盒-本安分线盒-矿用电话接线盒-JHH生产厂家-宁波龙亿电子科技有限公司 | 工业风机_环保空调_冷风机_工厂车间厂房通风降温设备旺成服务平台 | 长信科技产业园官网_西安厂房_陕西标准工业厂房| 中式装修设计_全屋定制家具_实木仿古门窗花格厂家-喜迎门 | 世界箱包品牌十大排名,女包小众轻奢品牌推荐200元左右,男包十大奢侈品牌排行榜双肩,学生拉杆箱什么品牌好质量好 - Gouwu3.com | 新疆系统集成_新疆系统集成公司_系统集成项目-新疆利成科技 | 电动高压冲洗车_价格-江苏速利达机车有限公司 | 1000帧高速摄像机|工业高速相机厂家|科天健光电技术 | 德州网站制作 - 网站建设设计 - seo排名优化 -「两山建站」 | 网站优化公司_北京网站优化_抖音短视频代运营_抖音关键词seo优化排名-通则达网络 | 天津云仓-天津仓储物流-天津云仓一件代发-顺东云仓 | 长沙广告公司|长沙广告制作设计|长沙led灯箱招牌制作找望城湖南锦蓝广告装饰工程有限公司 | 艺术涂料|木纹漆施工|稻草漆厂家|马来漆|石桦奴|水泥漆|选加河南天工涂料 | 单级/双级旋片式真空泵厂家,2xz旋片真空泵-浙江台州求精真空泵有限公司 | 干洗店加盟_洗衣店加盟_干洗店设备-伊蔻干洗「武汉总部」 | 清管器,管道清管器,聚氨酯发泡球,清管球 - 承德嘉拓设备 | 北京西风东韵品牌与包装设计公司,创造视觉销售力! | 台式低速离心机-脱泡离心机-菌种摇床-常州市万丰仪器制造有限公司 | 继电器模组-IO端子台-plc连接线-省配线模组厂家-世麦德 | 硫酸亚铁-聚合硫酸铁-除氟除磷剂-复合碳源-污水处理药剂厂家—长隆科技 | 河南新乡德诚生产厂家主营震动筛,振动筛设备,筛机,塑料震动筛选机 | VI设计-LOGO设计公司-品牌设计公司-包装设计公司-导视设计-杭州易象设计 | 熔体泵_熔体出料泵_高温熔体泵-郑州海科熔体泵有限公司 |