-
>
全國計算機等級考試最新真考題庫模擬考場及詳解·二級MSOffice高級應用
-
>
決戰行測5000題(言語理解與表達)
-
>
軟件性能測試.分析與調優實踐之路
-
>
第一行代碼Android
-
>
JAVA持續交付
-
>
EXCEL最強教科書(完全版)(全彩印刷)
-
>
深度學習
PYTHON數據分析與挖掘實戰 第3版 版權信息
- ISBN:9787111764793
- 條形碼:9787111764793 ; 978-7-111-76479-3
- 裝幀:平裝-膠訂
- 冊數:暫無
- 重量:暫無
- 所屬分類:>>
PYTHON數據分析與挖掘實戰 第3版 本書特色
(1)作者背景權威:泰迪智能科技股份有限公司董事長,華南師范大學、中南財經政法大學等30余所高校兼職教授或碩導。
(2)作者經驗豐富:在大數據挖掘與分析領域有10余年工程實踐、教學和創辦企業經驗,承擔國家級項目1項,省部級項目4項;榮獲中國產學研合作促進獎、數字信訪重大突破獎、南方電網發明專利獎、省科技進步獎、省教學成果獎等10余項省部級獎項。
(3)公認經典著作:院校師生和數據科學工作者公認的數據挖掘經典著作,是該領域的事實標準。
(4)暢銷書全新升級:前2版銷售超過15萬冊,被國內100余所院校采用為教材,好評如潮。
(5)配套資源豐富:提供數據文件、程序源碼、教學課件、教學大綱等各種資源,便于讀者自學和教學。
PYTHON數據分析與挖掘實戰 第3版 內容簡介
內容簡介 本書是Python數據分析與挖掘領域的公認的事實標準,前兩版銷售超過15萬冊,被國內100余所院校采用為教材,同時也被廣大數據科學工作者奉為經典。 本書以真實項目案例為驅動,以真實的行業應用為依托,幫助讀者快速掌握數據分析與挖掘的相關技術、流程與方法。本書精選了7個經典實戰案例,涵蓋了房地產、零售、互聯網等多個領域,將Python編程知識、數據分析與挖掘知識和行業知識融合,讓讀者在實踐中快速地掌握針對不同行業的數據挖掘方法。 本書不僅適合零基礎的讀者自學,還適合作為相關專業的教材。為了幫助讀者更加高效地掌握本書的內容,本書提供了以下附加價值: (1)上機環境:提供相關工具的環境配置文件,省去配置環境的煩瑣操作,方便省心。 (2)數據文件:提供各個案例配套的數據文件,開箱即用,增強實操性。 (3)程序代碼:提供書中代碼的電子文件,代碼導入環境即可運行,學習效果立竿見影。 (4)教學課件:提供配套的PPT課件,使用本書作為教材的老師可以申請,節省備課時間。 通過學習本書,讀者可以理解數據分析與挖掘的原理,迅速掌握大數據技術的相關操作,為后續數據分析、數據挖掘、深度學習的實踐打下良好的技術基礎。
PYTHON數據分析與挖掘實戰 第3版PYTHON數據分析與挖掘實戰 第3版 前言
Preface 前 言
為什么要寫本書
數據挖掘是從大量數據(包括文本)中挖掘出隱含的、先前未知的、對決策有潛在價值的關系、模式和趨勢,并用這些知識和規則建立用于決策支持的模型,提供預測性決策支持的方法、工具和過程。數據挖掘有助于企業發現業務的趨勢,揭示已知的事實,預測未知的結果,已成為企業保持競爭力的必要方法。
在云時代和數字經濟時代背景下,大數據技術的重要性與日俱增。大數據已經成為各行各業不可或缺的生產要素,其應用預示著生產率增長和消費者剩余的新浪潮。大數據分析技術不僅可以幫助企業高效地獲取、管理和處理海量數據,還可以為企業的決策提供積極的輔助。作為數據存儲和挖掘分析的前沿技術,大數據分析在物聯網、云計算、移動互聯網等戰略性新興產業中得到了廣泛應用。大數據在國內的商業價值已經顯現,具有實踐經驗的大數據分析人才已成為企業爭奪的焦點。
為了滿足不斷增長的大數據分析人才需求,越來越多的大學開始開設大數據分析課程,將其作為數學與統計學專業的重要課程。該課程采用理論與實踐相結合的教學方式,為學生提供一個真實的學習和實踐環境,讓他們能夠更快地掌握數據挖掘知識,積累職業經驗,以便為未來的數字經濟和新質生產力的發展做好準備。
PYTHON數據分析與挖掘實戰 第3版 目錄
目 錄 Contents
前言
基礎篇
第1章 數據挖掘基礎2
1.1 某知名連鎖餐飲企業的困惑2
1.2 從餐飲服務到數據挖掘4
1.3 數據挖掘的基本任務4
1.4 數據挖掘的建模過程5
1.4.1 目標定義5
1.4.2 數據采集6
1.4.3 數據探索7
1.4.4 數據預處理8
1.4.5 挖掘建模8
1.4.6 模型評價8
1.5 常用的數據挖掘建模工具8
1.6 小結10
第2章 Python數據分析簡介11
2.1 搭建Python開發平臺12
2.1.1 需要考慮的問題12
2.1.2 基礎平臺的搭建13
2.2 Python使用入門14
2.2.1 運行方式14
2.2.2 基本命令15
2.2.3 數據結構18
2.2.4 庫的導入與添加23
2.3 Python數據分析工具25
2.3.1 NumPy26
2.3.2 SciPy27
2.3.3 Matplotlib28
2.3.4 pandas29
2.3.5 StatsModels31
2.3.6 scikit-learn31
2.3.7 Keras33
2.3.8 Gensim35
2.3.9 TensorFlow35
2.3.10 PyTorch39
2.3.11 PaddlePaddle42
2.3.12 XGBoost45
2.4 配套附件使用設置47
2.5 小結47
第3章 數據探索48
3.1 數據質量分析48
3.1.1 缺失值分析49
3.1.2 異常值分析49
3.1.3 一致性分析53
3.2 數據特征分析53
3.2.1 分布分析53
3.2.2 對比分析58
3.2.3 統計量分析60
3.2.4 周期性分析63
3.2.5 貢獻度分析65
3.2.6 相關性分析67
3.3 Python的主要數據探索函數71
3.3.1 基本統計特征函數71
3.3.2 拓展統計特征函數75
3.3.3 統計繪圖函數76
3.4 小結83
第4章 數據預處理84
4.1 數據清洗84
4.1.1 缺失值處理84
4.1.2 異常值處理89
4.1.3 重復值處理89
4.2 數據集成91
4.2.1 實體識別91
4.2.2 冗余屬性識別91
4.3 數據變換92
4.3.1 簡單函數變換92
4.3.2 數據規范化92
4.3.3 連續屬性離散化95
4.3.4 屬性構造97
4.3.5 小波變換98
4.4 數據歸約101
4.4.1 屬性歸約101
4.4.2 數值歸約106
4.5 Python的主要數據預處理函數109
4.6 小結111
第5章 挖掘建模113
5.1 分類與預測113
5.1.1 實現過程114
5.1.2 常用的分類與預測算法114
5.1.3 回歸分析115
5.1.4 決策樹119
5.1.5 人工神經網絡126
5.1.6 分類與預測算法評價131
5.1.7 Python的分類預測模型136
5.2 聚類分析136
5.2.1 常用的聚類分析算法137
5.2.2 k均值聚類算法138
5.2.3 聚類分析算法評價143
5.2.4 Python的主要聚類分析算法144
5.3 關聯規則146
5.3.1 常用的關聯規則算法147
5.3.2 Apriori算法147
5.4 時序模式153
5.4.1 時間序列算法153
5.4.2 時間序列的預處理154
5.4.3 平穩時間序列分析156
5.4.4 非平穩時間序列分析159
5.4.5 Python的主要時序模式算法167
5.5 離群點檢測170
5.5.1 離群點的成因及類型170
5.5.2 離群點檢測方法171
5.5.3 基于統計模型的離群點
檢測方法172
5.5.4 基于聚類的離群點檢測方法174
5.6 小結177
實戰篇
第6章 房屋租金影響因素分析
與預測180
6.1 背景與挖掘目標180
6.2 分析方法與過程181
6.2.1 數據預處理181
6.2.2 數據探索190
6.2.3 模型構建201
6.3 上機實驗207
6.4 拓展思考208
6.5 小結209
第7章 商超客戶價值分析210
7.1 背景與挖掘目標210
7.2 分析方法與過程211
7.2.1 數據探索與預處理212
7.2.2 模型構建及結果分析228
7.3 上機實驗238
7.4 拓展思考239
7.5 小結240
第8章 商品零售購物籃分析241
8.1 背景與挖掘目標241
8.2 分析方法與過程242
8.2.1 數據探索分析243
8.2.2 數據預處理249
8.2.3 模型構建249
8.3 上機實驗255
8.4 拓展思考256
8.5 小結256
第9章 基于水色圖像的水質評價257
9.1 背景與挖掘目標257
9.2 分析方法與過程258
9.2.1 分析流程259
9.2.2 數據預處理259
9.2.3 模型構建263
9.2.4 水質評價264
9.3 上機實驗265
9.4 拓展思考265
9.5 小結266
第10章 家用熱水器用戶行為
分析與事件識別267
10.1 背景與挖掘目標267
10.2 分析方法與過程268
10.2.1 數據探索分析269
10.2.2 數據預處理272
10.2.3 模型構建283
10.2.4 模型檢驗284
10.3 上機實驗285
10.4 拓展思考287
10.5 小結288
第11章 電視產品個性化推薦289
11.1 背景與挖掘目標289
11.2 分析方法與過程290
11.2.1 分析流程291
11.2.2 數據預處理291
11.2.3 分析與建模306
11.2.4 模型評價310
11.3 上機實驗313
11.4 拓展思考314
11.5 小結314
第12章 天問一號事件中的網民
評論情感分析315
12.1 背景與挖掘目標315
12.2 分析方法與過程316
12.2.1 分析流程316
12.2.2 數據說明317
12.2.3 數據探索318
12.2.4 文本預處理323
12.2.5 繪制詞云圖327
12.2.6 使用樸素貝葉斯構建
情感分析模型331
12.2.7 模型評價338
12.2.8 模型優化340
12.3 上機實驗344
12.4 拓展思考345
12.5 小結345
提高篇
第13章 基于TipDM大數據挖掘
建模平臺實現商超客戶
價值分析348
13.1 平臺簡介348
13.1.1 “共享庫”模塊350
13.1.2 “數據連接”模塊350
13.1.3 “數據集”模塊350
13.1.4 “我的工程”模塊351
13.1.5 “個人組件”模塊354
13.2 快速構建數據挖掘工程355
13.2.1 數據源配置355
13.2.2 數據探索與處理360
13.2.3 模型構建與結果分析379
13.3 小結393
PYTHON數據分析與挖掘實戰 第3版 作者簡介
資深大數據挖掘專家和模式識別專家,高級信息項目管理師。10余年大數據挖掘應用、咨詢和培訓經驗。為電信、電力、政府、互聯網、生產制造、零售、銀行、生物、化工、醫藥等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗非常豐富。精通Java EE企業級應用開發,是華南師范大學、中南財經政法大學、廣東工業大學、西安理工大學、廣西科技大學、重慶交通大學、桂林電子科技大學等校外碩導。
- >
新文學天穹兩巨星--魯迅與胡適/紅燭學術叢書(紅燭學術叢書)
- >
上帝之肋:男人的真實旅程
- >
羅庸西南聯大授課錄
- >
史學評論
- >
名家帶你讀魯迅:故事新編
- >
人文閱讀與收藏·良友文學叢書:一天的工作
- >
莉莉和章魚
- >
自卑與超越